Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Instituto Tecnológico Superior: Antologia
Instituto Tecnológico Superior: Antologia
de Acayucan
ANTOLOGIA
Presenta:
ACAYUCAN, VER.
JUNIO 2008
Probabilidad y Estadstica
INDICE
UNIDAD 1
OBJETIVO GENERAL...............................................................................
10
JUSTIFICACION........................................................................................
11
ESTADISTICA DESCRIPTIVA.........
12
13
13
16
16
1.1.4 Poblacin....................................................................................
16
20
20
20
21
22
22
22
22
23
III
1.2.5 Lmites........................................................................................
23
1.2.6 Histograma..................................................................................
23
24
25
25
1.3.2 Mediana......................................................................................
29
1.3.3 Moda...........................................................................................
31
35
1.4.1 Varianza......................................................................................
35
36
38
38
1.4.5 Rango.........................................................................................
38
39
1.5.1 La media.....................................................................................
39
39
41
42
43
44
44
45
IV
UNIDAD 2
46
46
46
46
47
47
50
52
59
1.8 Histograma.......
59
59
59
1.8.3 Ojivas.........................................................................................
60
61
62
PROBABILIDAD.
65
66
66
69
69
69
71
71
71
71
72
76
80
2.3.3 Permutacin................................................................................
81
2.3.4 Combinaciones...........................................................................
91
100
2.4.1 Axiomas......................................................................................
100
2.4.2 Teoremas....................................................................................
100
101
2.5.2 Independiente.............................................................................
110
UNIDAD 3
101
113
113
121
121
121
VI
UNIDAD 4
122
123
123
129
132
139
146
146
156
161
161
162
ESTADSTICA APLICADA...
170
171
4.1.1 Concepto.....................................................................................
171
4.1.2 Estimacin..................................................................................
171
171
172
172
172
VII
172
173
174
183
186
189
UNIDAD 5
196
203
214
220
223
REGRESIN Y CORRELACIN...
216
5.1 Introduccin
217
217
218
219
221
221
222
222
222
VIII
5.3.2. Modelos.....................................................................................
223
223
224
230
233
233
238
245
Anexos..
255
..
Bibliografa.
262
IX
OBJETIVO GENERAL
10
JUSTIFICACION
11
UNIDAD 1
ESTADISTICA
DESCRIPTIVA
Objetivo:
El estudiante conocer fundamentos
y tcnicas bsicas de estadstica,
para organizar, representar y analizar
datos obtenidos de una situacin
simulada o real.
El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre
todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la
probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. La probabilidad
es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la
cantidad de datos necesarios en un determinado estudio estadstico. Cuando a travs de
una muestra pretendemos obtener informacin de una poblacin entera los datos obtenidos
puede ser diferente a los reales. Son valores aproximados del parmetro desconocido. A
estos valores se les llama Estimaciones.
Al dar una estimacin estoy cometiendo un error llamado error de muestreo debido a que no
se esta considerando a toda la poblacin, sino a una parte de ella. Existen procedimientos
que pueden determinar de antemano el error que puedo cometer.
13
Aparte de estos, existen otros errores que se presentan tanto en encuestas por muestreo
como en las encuestas por censo. Este tipo de errores son mayores y de difcil correccin.
Son errores ajenos al muestreo.
Qu es un experimento comparativo?
Es una investigacin cuya finalidad es comparar los efectos de dos o ms estmulos
(tratamientos A y B) aplicados a ciertos entes (unidades de experimentacin
,).
Para ello se efectan mediciones sobre los efectos de ambos tratamientos obtenindose los
resultados (
).
).
14
Qu es un estudio observacional?
Es una investigacin comparativa sin la asignacin aleatoria que se hace en los
experimentos (o investigacin de muestreo no probabilstico), cuya finalidad es tambin
comparar los efectos que dos o mas condiciones ( A y B) tienen sobre los entes observados
,
Divisin de la estadstica
Se divide en dos partes:
Re copilar
Condensar
Divisin Estadistica
Caracteristicas
Inferencial ( Inferencia)
muestras
15
1.1.4 Poblacin.
La poblacin, es el conjunto de todas las muestras posibles, que pueden obtenerse del
sistema en estudio de acuerdo al mtodo de seleccin empleado.
La poblacin, entonces, es el total hipottico de los datos que se estudian o recopilan. El
tamao de la poblacin se saca contando el nmero de elementos componentes. A veces es
un conteo simple, pero otras veces se trata de conteos ordenados.
A continuacin muestra las formas de observar una poblacin.
16
17
Etapa 2 - Relevamientos: esta etapa consiste en determinar lo que se tiene para alcanzar los
objetivos definidos en la etapa anterior. Se trata de listar los bienes necesarios para poder hacer
el trabajo, y el listado de los disponibles. Conviene tener en cuenta la siguiente clasificacin de
los bienes: Tangibles e Intangibles.
Por su parte, los bienes tangibles son dos:
Por equipamiento se entiende no slo los aparatos de medicin, sino los accesorios
como muebles y tiles de laboratorio y para oficina.
El dinero o los recursos monetarios deben ser determinados con mucho detalle para
afrontar gastos e inversiones durante la investigacin. Adems, hay que determinar los
fondos disponibles y las posibles fuentes financieras adonde poder recurrir.
los conocimientos para saber cmo usarlos. Esto es el know how de cada profesin. Y
tambin lo es la bsqueda bibliogrfica de trabajos similares en revistas especializadas,
textos y otras fuentes de informacin. Una vez terminada esta etapa, que seguramente
habr ayudado a depurar la anterior, se debe comenzar a pensar en las diferentes
maneras de hacerlo.
Etapa 3 - Creacin de alternativas: esta etapa consiste en saber cmo hacerlo. O sea,
generar distintas alternativas de sistemas de recopilacin de datos, de acuerdo con los objetivos
adoptados y los bienes disponibles. Se debe hacer un listado con todas las formas posibles de
18
19
aquellas medidas que describen a una muestra se les llama estadsticos o estimadores, y son
representados por letras de nuestro alfabeto (por ejemplo, x o s). Tales medidas cuantitativas
que describen a las poblaciones y a las muestras se comentarn enseguida. Se considera que
se conoce una poblacin cuando conocemos la distribucin de probabilidad f(x) de la variable
aleatoria asociada X.
20
los que reemplaza y mejora por cuanto no implica aproximaciones ni requiere de la introduccin
de nuevos conceptos.
p ( x) =
p ( ) p ( x )
p( x)
S {g ( )} = g ( ) p ( ) p (z )d
El anlisis Bayesiano, en otra diferencia con la estadstica clsica, permite incorporar en un
estudio informacin de distintas fuentes, incluso subjetivas.
De esta manera concibe, en un plano muy general, las tcnicas estadsticas como mecanismos
para la actualizacin del conocimiento particular o general, individual o colectivo sobre el estado
que guarda la naturaleza."
21
Nmero de
estudiantes f
60 62
63 65
20
66 68
44
69 71
29
72 74
10
Total 110
frecuencia relativa =
numero de estudiante
total
22
Altura ( in)
Nmero de
Frecuencia
estudiantes (f)
relativa
60 62
0.0636
63 65
20
0.1818
66 68
44
0.4
69 71
29
0.2636
72 74
10
0.0909
total
110
1.0000
60 + 62
= 61
2
1.2.5 Lmites.
Tomando encuenta la clase 60 - 62 se dice que se llaman lmites de clases, el 60 se llama
lmite inferior de clase y el 62 se llama lmite superior de clase.
1.2.6 Histograma.
Es una representacin grafica para la distribucin de frecuencia. Un histograma o histograma de
frecuencias, consiste en un conjunto de rectngulos con:
a)
base en el eje x horizontal, centros en las marcas de clases y longitudes iguales a los
tamaos de los intervalos de clase y
b)
23
Altura ( in)
Nmero de
Marca de
estudiantes (f)
clases (X)
60 62
61
63 65
20
64
66 68
44
67
69 71
29
70
72 74
10
73
total
110
frecuencia
50
40
30
20
10
0
58
61
64
67
70
73
76
Numero de
Frecuencia
estudiantes (f)
relativa
60 62
0.0636
63 65
20
0.1818
66 68
44
0.4
69 71
29
0.2636
72 74
10
0.0909
total
110
1.0000
Frec. Rel.
24
UN
NIDAD I / ESTADIST
TICA DESC
CRIPTIVA
A.
Problemas
s propuesto
os:
Problema: El rascn terrestre o guin
g
de las codornices es una ave
e europea en
e peligro de
e
m
En fechas recientes se lle
ev a cabo un censo de rascones cantores en
n
extincin mundial.
terrenos ag
grcolas de Gran
G
Breta
a e Irlanda (Journal of applied ecollogy) . La ta
abla indica el
e
numero total de rascon
nes terrestress que habitan
n en cada de
e 10 reas ge
eogrficas.
rea
Numero de rascones
s
terrestres
12
15
3. Orkn
ney y Shetlan
nd
34
4. Lewiis y Harris
76
5. N. Uist y Benbeccula
82
6. S. Uist y Barra
155
7. Hebrridas interiorres
76
8. Coll y Tirce
121
128
10. Repu
ublica de Irla
anda
789
T
Total
1
1488
esuma los da
atos con un histograma
h
a) Re
1.3.
edidas de tendencia
a central.
Me
1.3.1 Med
dia aritm
tica, geom
mtrica y ponderad
p
a.
Media aritm
mtica
Sean, x1 ,xx2 ,....,xn , n observacione
o
es mustrale
es, definiremos promedio
o de estas ob
bservacioness
al valor dad
do por:
o bien
255
x + x 2 + x 3 + ... + x n
x= 1
=
N
x
j =1
x
N
8 + 3 + 5 + 12 + 10 38
=
= 7. 6
5
5
x=
f x + f 2 x 2 + ... + f k x k
=
x= 1 1
f1 + f 2 + ... + f k
f
j =1
xj
f
j =1
x=
fx
N
10
= 5 .7
26
P. Ap. Verbal
P. Ap. Matemtica
P. Ap. Verbal
P. Ap. Matemtica
685
664
730
642
490
548
618
533
580
567
690
654
705
665
680
542
470
452
690
678
620
506
710
732
650
618
742
749
702
718
685
570
643
621
595
574
540
555
674
657
575
502
722
747
600
531
585
620
500
478
505
482
680
558
600
643
587
600
543
500
27
UN
NIDAD I / ESTADIST
TICA DESC
CRIPTIVA
A.
La Media g
geomtrica G
La media g
geomtrica es el resultado de multiplicar todos los
s elementos y extraer la raz n -sima
a
del productto:
mathcaad
gmeaan ( 2 , 4 , 8) = 4
Promedio Ponderado.
En muchass ocasiones, las observa
aciones recollectadas no tienen la missma importa
ancia relativa
a.
Para hacerr presente este hecho en la bsqued
da de un 'ce
entro' que re
epresente a los datos, es
s
necesario asignar
a
a cad
da uno de s
stos, una ponderacin (p
peso o coefic
ciente) que re
epresente su
u
importancia
a dentro de la muestra.
Definicin.
A veces as
sociada con los
l nmeros X1, X2, . . . XK , ciertos factores
f
peso
os ( o pesos ) W1, W2 ,...,
WK depend
dientes de la
a relevancia asignada
a
a ccada nmero
o.
x=
(1)(70
7 ) + (1)(90 ) + (3)(85) 415
=
= 83
1+1+ 3
Ejercicios
s:
a) halllar la media aritmtica de
d los nmerros 5, 3, 6, 5,
5 4, 5, 2, 8, 6,
6 5, 4, 8, 3, 4, 5, 4, 8, 2,
2
5, y 4
Solucin: 4.8
28
8
b) De entre 100 nmeros. 20 son cuatros, 40 son cinco, 30 son seis y los restantes siete.
Hallar su media aritmtica.
Solucin: 5.30
c) las calificaciones finales de un estudiante en cuatro asignatura fueron 82, 86, 90 y 70. si
los respectivos crditos otorgados a esos cursos son 3, 5, 3 y 1 , determinar una
calificacin media a apropiada.
Solucin: 85
d) De los 80 empleados de una empresa 6 cobra $ 7,00 a la hora y el resto $4,00 a la
hora. Hallar cuanto cobran de media por hora
Solucin: $6.25
e) Cuatro grupos de estudiantes, consistentes en 15, 20, 10 y 18 individuos, dieron pesos
medios de 162, 148, 153 y 140 lb., respectivamente . hallar el peso medio de todos
esos estudiantes.
Solucin: 150 lb.
1.3.2 Mediana.
La mediana de un conjunto de nmeros ordenados en magnitud es el valor central o la media
de los dos valores centrales.
Datos sin agrupar:
Ejemplo: el conjunto de nmeros 3, 4, 4, 5, 6, 8, 8, 8, 10 tiene mediana 6
mathcad
median ( 3 , 4 , 4 , 5 , 6 , 8 , 8 , 8 , 10) = 6
29
Ejemplo: cinco oficinistas cobran $ 4.52, $ 5.96, $ 5.28, $ 11.20 y $ 5.75 a la hora. Hallar la
mediana
Solucin = la ordenacin es: $ 4.52, $ 5.28, $ 5.75 , $ 5.96, $ 11.20
La mediana es $ 5.75
Datos Agrupados:
Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas,
nos plantea de nuevo dos situaciones diferentes a considerar:
( f )1
C
mediana = L1 + 2
f mediana
donde:
L1 = frontera inferior de la clase mediana.
N = numero de datos (frecuencia total)
( f ) 1 = suma de la frecuencia de las clases inferiores a la de la mediana.
f mediana = frecuencia de la clase mediana.
C = anchura del intervalo de clase de la mediana.
Ejemplo:
Altura ( in)
60 62
63 65
20
66 68
44
69 71
29
72 74
10
total
110
110
= 55 ; entonces se procede a realizar una suma con las
2
frecuencias (f) hasta llegar al valor 55 o mas de 55 pero no menos, para suponer que ah cae la
mediana solo que se tiene que hacer es verificar su valor.
7 + 20+ 44 = 71 por lo tanto cae en el intervalo 66 68
30
Datos:
L1 = 65.5 ; N = 110 ;
( f )
110
27
(3) = 67.41
mediana = 65.5 + 2
44
1.3.3 Moda.
La moda de un conjunto de nmeros es el valor que ocurre con mayor frecuencia; es decir, el
valor mas frecuente. La moda puede no existir e incluso no ser nica. Esta estadstica debe
usarse con cuidado. Su objetivo es identificar zonas donde se producen aglomeraciones de
datos, sin embargo, podra ser que por el solo hecho de haber una observacin extra en un
punto aislado, ste pudiese aparecer como una moda.
Este inconveniente es especialmente delicado cuando hay pocas observaciones en la muestra,
tal como es el caso que se observa en el grfico siguiente.
Datos sin agrupar:
Ejemplo: el conjunto 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 tiene como moda 9
mathcad
mode( 2 , 2 , 5 , 7 , 9 , 9 , 9 , 10 , 10 , 11 , 12 , 18) = 9
1
C
mod a = L1 +
1 + 2
donde:
L 1 = frontera inferior de la clase modal ( clase que contiene a la moda)
31
60 62
63 65
20
66 68
44
69 71
29
72 74
10
total
110
De acuerdo a la definicin la moda ser quien tenga mayor frecuencia por lo tanto cae en el
intervalo 66 68
32
Anlogamente los valores que dividen a los datos en 10 partes iguales se llaman deciles y se
denotan D1 , D2 , . . . , D9 , mientras los valores que se dividen en 100 partes iguales se llaman
percentiles denotados P1 , P2 , . . . , P 99 .
Colectivamente cuartiles, deciles y percentiles se denominan cuantiles.
Altura ( in)
60 62
63 65
20
66 68
44
69 71
29
72 74
10
total
110
Hallar Cuartiles:
N / 4 = 100 / 4 = 25
5 + 18 = 23
65.5 +
63 65 62.5 65.5
( 25 23 )
42
( 3) = 65.64
2N / 4 = 2(100) / 4 = 50
5 + 18 = 23
63 65 62.5 65.5
5 + 18 + 42 = 65
65.5 +
( 50 23 )
42
( 3 ) = 67.43
3N / 4 = 3(100) / 4 = 75
66 68 65.5 68.5
5 + 18 +42 = 65
68.5 +
( 75 65 )
27
( 3) = 69.61
33
= 10
2( 100)
10
= 20
( 10 5)
62.5 +
18
62.5 +
( 3) = 63.33
( 20 5)
18
( 3) = 65
5+ 18 = 23
3( 100)
10
= 30
65.5 +
( 30 23)
42
( 3) = 66
5+ 18 = 23
4( 100)
10
= 40
65.5 +
65.5 +
65.5 +
68.5 +
68.5 +
( 40 23)
42
( 3) = 66.71
5+ 18 = 23
5( 100)
10
= 50
( 50 23)
42
( 3) = 67.43
5+ 18 = 23
6( 100)
10
= 60
( 60 23)
42
( 3) = 68.14
5+ 18 + 42 = 65
7( 100)
10
= 70
( 70 65)
27
( 3) = 69.06
5+ 18 + 42 = 65
8( 100)
10
= 80
( 80 65)
27
( 3) = 70.17
5+ 18 + 42 = 65
34
9( 100)
10
= 90
68.5 +
( 90 65)
27
( 3) = 71.28
Hallar percentiles P 35 y P 50
35 (100) / 100 = 35
P
35
65.5 +
( 35 23 )
42
( 3 ) = 66.36
50 (100) / 100 = 50
P
50
1.4.
65.5 +
( 50 23 )
42
( 3 ) = 67.43
Medidas de dispersin.
Medidas de Posicin.
La descripcin de un conjunto de datos, incluye como un elemento de importancia la ubicacin
de stos dentro de un contexto de valores posibles. Por ejemplo, puede resultar de inters
conocer qu porcentaje de automviles equipados con convertidor cataltico sobrepasa el
estndar de emisiones de gases que es aceptable segn la legislacin vigente. Ya no se trata
en este ejemplo de describir el centro de un conjunto de datos de esta naturaleza. Es necesario
ser ms especfico. Es probable que la emisin promedio de un conjunto de automviles est
dentro de la norma. Pero,es aceptable que el 25% de ellos no la cumpla?. Se ve, entonces,
que la descripcin debe entregar ms informacin de los datos para cubrir las necesidades
informativas referentes a un problema en particular.
1.4.1 Varianza.
Cuadrada para poder compararla con la media y otras medidas anlogas. Esta es la idea del
desvo estndar o desviacin tpica. Tambin es la frmula planteada por Gauss en su teora
de errores casuales. Como se ver ms adelante, la curva de Gauss tiene dos puntos de
inflexin simtricos ubicados a una distancia del centro igual al desvo estndar.
35
La varianza
La varianza es el promedio de los cuadrados de las desviaciones de cada elemento, x i,
respecto a la media,
La varianza de un conjunto de datos se define como el cuadrado de la desviacin tpica y viene
dada en consecuencia por S2 . varianza poblacional (s 2)
(x
N
S2 =
j =1
x)
n
yi
n
n
2
2
y i i =1
( xi x )
n
= i =1
2 = i =1
n 1
n 1
(x
N
S=
j =1
x)
El uso de esta estadstica es recomendado en aquellos conjuntos de datos que ofrecen cierto
grado de simetra respecto de su centro. En estos casos, habitualmente tiene sentido medir
discrepancias de un valor con el centro de los datos usando mltiplos de la desviacin estndar.
36
A modo de ejemplo, se puede decir que un valor est bastante alejado del centro de los datos si
su distancia de l supera dos desviaciones estndar. Apoyndose en la idea anterior, la
desviacin estndar puede ser usada para determinar valores que se encuentran 'cerca' del
centro. Este uso va ms all de la simple descripcin, en otros mbitos de Estadstica es usada
para tomar decisiones respecto de la poblacin de la que fue extrada la muestra.
Ejercicio: Calcular la desviacin estndar de los siguientes datos:
68.2, 69.3, 70.4, 71.5, 72.6, 73.7, 74.8,
prom:=
prom = 71.5
desv :=
( 68.2 71.5 ) + ( 69.3 71.5 ) + ( 70.4 71.5 ) + ( 71.5 71.5 ) + ( 72.6 71.5 ) + ( 73.7 71.5 ) + ( 74.8 71.5 )
desv = 2.2
de
exposiciones
de
imagen
espectral
independientes
para
40
observaciones de asteroides.
3
a) Localice
y y s en el listado
y s , y 2 s , y 3s
37
es
M .D. =
x
j =1
media aritmetica =
5
con mathcad
=6
mean ( 2 , 3 , 6 , 8 , 11) = 6
desviacion media
MD =
2 6 + 3 6 + 6 6 + 8 6 + 11 6
5
= 2.8
D Me =
Me n j
n
1.4.5 Rango.
La ms simple de todas es el rango, definido como la diferencia entre el valor mximo y
mnimo del grupo de datos. De fcil clculo y comprensin, tiene la desventaja de ser la
medida ms grosera de la dispersin.
Dos grupos de datos, con muy distinta dispersin pueden llegar a tener rangos similares. Uno
de ellos puede tener el 99% de los valores junto al mnimo y el otro el 99% junto al mximo,
pero al tener extremos iguales, sus rangos resultaran iguales a pesar de ser tan dismiles
intrnsecamente.
RANGO = Mx. datos - Mn. datos
38
UNID
DAD I / ES
STADISTIC
CA DESCR
RIPTIVA.
1.5
Pa
armetros para dato
os agrupados.
1.5.1 La
a media.
Sean, x1 ,x2 ,....,xn , n obserrvaciones mustrales,
m
definiremos promedio de estas
observacio
ones al valor dado por:
o bien
N
x + x 2 + x3 + ... + x n
x= 1
=
N
x
x=
N
x
j =1
Ejemplo: La
a media aritm
mtica de los
s nmeros 8, 3. 5, 12 y 10
x=
8 + 3 + 5 + 122 + 10 38
=
= 7.6
5
5
a desviaci
n tpica.
1.5.2 La
A su vez, el desvo estndar
e
pob
blacional ( ) y el mue
estral ( s) se obtienen con
c
la raz
d las respec
ctivas varian
nzas y Repre
esenta el ale
ejamiento de una serie de nmeros
cuadrada de
de su valorr medio. Se calcula
c
a parrtir de todas las desviacio
ones individu
uales con res
specto a la
media.
f (x
k
S=
j =1
x)
f
j =1
39
xj
x j x ( x j x ) 2 f j (x j x )
fj
68.2
-2.6358 6.9477
34.7385
69.3
11
-1.5358 2.3588
25.9472
70.4
14
-0.4358 0.1900
2.6595
71.5
11
0.6642 0.4411
4.8521
72.6
1.7642 3.1122
21.7856
73.7
2.8642 8.2034
24.6101
74.8
Total 53
x=
146.0219
70.8358
Desv.
Est. = 1.6599
Y la desviacin media para datos agrupados:
k
DM =
f
j =1
xj x
f
j =1
xj
fj
xj x
f j xj x
68.2
2.6358
13.1792
69.3
11
1.5358
16.8943
70.4
14
0.4358
6.1019
71.5
11
0.6642
7.3057
72.6
1.7642
12.3491
73.7
2.8642
8.5925
74.8
3.9642
7.9283
Total
53
72.3509
x=
70.8358
Desv. Med. =
1.3651
40
manera:
Intervalo
= anchura de clase
# clases
O bien,
Intervalo
= # clase
anchura de clases
Si la precisin es:
una unidad entera (1) entonces es 1/2 = 0.5, la primera clases comenzar restndole 0.5
a la observacin mas pequeo
una unidad decimal (0.1) entonces es 0.1/2 = 0.05, la primera clases empieza restndole
0.05 a la observacin mas pequea.
Paso 3: para cada clase, contar el numero de observaciones que caen en esa clase. Este
nmero es la frecuencia de clases.
Datos obtenidos.
Por ejemplo: en la tabla que sigue se recogen los pesos de 40 estudiantes varones de una
universidad, con precisin de 1 libra. Construir una distribucin de frecuencias.
41
una muestra
1.61
1.16
1.38
3.53
1.23
3.76
1.94
0.96
4.75
0.15
2.41
0.71
0.02
1.59
0.19
0.82
0.47
2.16
2.01
0.92
0.75
2.59
3.07
1.40
42
de Tabulacin Frec.
clase
1
0.015 0.715
/////
0.715 1.415
/////////
1.415 2.115
////
2.115 2.815
///
2.815 3.515
3.515 4.215
//
4.215 4.915
43
de Frecuencia Distribucin
clase
de clase
acumulada
0.015 0.715
0.715 1.415
14
1.415 2.115
18
2.115 2.815
21
2.815 3.515
22
3.515 4.215
24
4.215 4.915 1
25
Total
25
Distribucion acumulada
30
25
20
15
10
5
0
1
Frecuencia relativa =
Frecuencia
N
44
Intervalo de clase
Frec.
Frec. relativa
0.015 0.715
0.20
20
0.715 1.415
0.36
36
1.415 2.115
0.16
16
2.115 2.815
0.12
12
2.815 3.515
0.04
3.515 4.215
0.08
0.04
25
1.00
4.215 4.915
Total
Intervalo de clase
Frec.
0.015 0.715
20
0.715 1.415
14
56
1.415 2.115
18
72
2.115 2.815
21
84
2.815 3.515
22
88
3.515 4.215
24
96
25
100
4.215 4.915
Total
25
45
DPA =
D. A
* 100
N
Distribucion Porcentual Acumulada
120
100
80
60
40
20
0
1
verdaderos limites de clase; el menor 117.5 es la frontera inferior y el mayor 122.5 la frontera
superior.
46
138
146
156
125
140
147
157
126
140
147
158
128
142
148
161
132
142
149
163
135
144
150
164
135
144
150
165
135
145
152
168
136
145
153
173
138
146
154
176
Los pesos son 176 y 119 lb.; El intervalo es 176 119 = 57 lb.
Si se usan 5 u 20 intervalos de clase su anchura ser:
57
= 11.4 = 11
5
57
= 2.85 = 3
20
47
Frecuencia
Distribucin
frecuencia
frecuencia
Distribucin
acumulada
relativa
relativa y ojivas
porcentuales
0.025
2.5
2.5
123 127
0.05
7.5
128 132
0.05
12.5
133 137
0.1
10
22.5
138 142
15
0.15
15
37.5
143 147
23
0.2
20
57.5
148 152
28
0.125
12.5
70
153 157
32
0.1
10
80
158 162
34
0.05
85
163 167
37
0.075
7.5
92.5
168 172
38
0.025
2.5
95
173 - 177
40
0.05
100
1.00
100
Total 40
Grficos
a) Distribucin acumulada
c)
Frecuencia
porcentual
acumulada
Distribucin acumulada
25
50
100
20
40
30
15
20
10
10
120
80
60
0
1
9 10 11 12
40
20
0
1
9 10 11 12
10 11 12
48
Histogram
14
12
Frequency
10
2
Mean = 146.8
Std. Dev. = 13.051
N = 40
0
110
120
130
140
150
160
170
180
PESO
Numero de estudiante
fx
30 39
34.5
34.5
40 49
44.5
133.5
50 59
11
54.5
599.5
60 69
21
64.5
1354.5
70 79
43
74.5
3203.5
80 89
32
84.5
2704
90 - 100
95.0
855
N = f = 120
fx = 8884.5
a) marca de clases
x 1 = 34.5; x2 =44.5; x3 = 54.5 ; x4 = 64.5 ; x5 = 74.5; x6 = 84.5 ; x7 = 95.0
b) media aritmtica
x=
fx = 8884.5 = 74.04
120
c) mediana
120/2 = 60
1 + 3 + 11 + 21 = 36
1 + 3 + 11 + 21 + 43 = 79
70 79
43 clase mediana
49
120
36
2
(10) = 75.08
mediana = 69.5 +
43
d) moda
70 79
43
22
mod a = 69.5 +
(10 ) = 76.17
22 + 11
Problema: En la tabla siguiente se recogen los pesos de 40 estudiantes varones de una
universidad con precisin de una libra.
Peso (lb.)
Frecuencia (f)
118 126
127 135
136 144
145 153
12
154 162
163 171
172 180
2
N = f = 40
Hallar:
a) Marca de clases
b) Media aritmtica
c) Mediana y moda
d) trazar un histograma y polgono de frecuencia
50
78
93
61 100 70 83
88 74 97 72
66
73
76 81
91 70 77 86
83 64
Ahora pensaremos en cada uno de los datos separando las decenas de las unidades, es decir,
el nmero 51 se ver como 5 | 1.
6
8 0 4 2 3 6 0 7
10
6
1
Para entenderle un poco ms, hemos de decir que el primer rengln que dice 6 | 1 6 4 quiere
decir que entre la lista de datos se encuentran los valores 61, 66 y 64. Esta es la representacin
grfica tallos y hoja, donde cada rengln es una posicin de tallos y cada dgito de la derecha
es una hoja.
El procedimiento para realizarla es primero empezar con los tallo, es decir la columna de la
izquierda, y despus dato por dato ir llenando las hojas a la derecha de la lnea vertical, en el
tronco correspondiente. Adems, si se desean tener los datos ordenados, y hay gente que lo
prefiere as, se pueden ordenar las hojas en cada rengln para que la representacin quede
como sigue:
6
10
4
0
2
3
6
4
3
3
7
6
8
8
7
En realidad una representacin de tallos y hojas presenta la misma informacin que la lista
original de datos, pero de una manera mucho ms compacta (especialmente si la lista de datos
es ms grande) y manejable.
Ejemplo: Los tiempos de CPU que se indican en la tabla representan el tiempo (en segundos)
que 25 trabajos estuvieron en control de la unidad central de proceso (CPU) de una
51
computadora mainframe grande. Estos 25 valores representan una muestra seleccionada de los
1000 tiempos de CPU:
1.17
1.61
1.16
1.38
3.53
1.23
3.76
1.94
0.96
4.75
0.15
2.41
0.71
0.02
1.59
0.19
0.82
0.47
2.16
2.01
0.92
0.75
2.59
3.07
1.40
Ramas hojas
Frecuencia
02 15 19 47 71 75 82 92 9
96
16 17 23 38 40 59 61 94 4
01 16 41 59
07 53 76
75
25
Ayuda a concentrarse en las causas que tendrn mayor impacto en caso de ser
resueltas.
Ayuda a evitar que se empeoren alguna causas al tratar de solucionar otras y puede
ser resueltas.
52
Cundo se utiliza?
Cuando existe la necesidad de llamar la atencin a los problema o causas de una forma
sistemtica.
Al analizar las diferentes agrupaciones de datos (ej: por producto, por segmento, del
mercado, rea geogrfica, etc.)
Pareto es una herramienta de anlisis de datos ampliamente utilizada y es por lo tanto til en la
determinacin de la causa principal durante un esfuerzo de resolucin de problemas. Este
permite ver cules son los problemas ms grandes, permitindoles a los grupos establecer
prioridades.
En casos tpicos, los pocos (pasos, servicios, tems, problemas, causas) son responsables por
la mayor parte el impacto negativo sobre la calidad. Si enfocamos nuestra atencin en estos
pocos vitales, podemos obtener la mayor ganancia potencial de nuestros esfuerzos por mejorar
la calidad.
Un equipo puede utilizar la Grfica de Pareto para varios propsitos durante un proyecto
para lograr mejoras:
Las Grficas de Pareto son especialmente valiosas como fotos de antes y despus
para demostrar qu progreso se ha logrado. Como tal, la Grfica de Pareto es una
herramienta sencilla pero poderosa.
53
Cmo se utiliza?
Reunir datos. La utilizacin de un check List puede ser de mucha ayuda en este paso.
trazar la escala del eje vertical izquierdo para frecuencia (de 0 al total, segn se calcul
anteriormente)
de izquierda a derecha trazar las barras para cada categora en orden descendente. Si
existe una categora otros, debe ser colocada al final, sin importar su valor. Es decir,
que no debe tenerse en cuenta al momento de ordenar de mayor a menor la frecuencia
de las categoras.
trazar la escala del eje vertical derecho para el porcentaje acumulativo, comenzando
por el 0 y hasta el 100%
dar un ttulo al grfico, agregar las fechas de cuando los datos fueron reunidos y citar la
fuente de los datos.
54
En cualquiera de los casos, parece que el principio de Pareto no aplica. Debido a que el mismo
se ha demostrado como vlido en literalmente miles de situaciones, es muy poco probable que
se haya encontrado una excepcin.
Es mucho ms probable que simplemente no se haya seleccionado un desglose apropiado de
las categoras.
Esto nos lleva a la conclusin que para llevar a cabo un proceso de Resolucin de Problemas
/Toma de Decisiones (RP/TD) es necesario manejar cada una de las herramientas bsicas de la
calidad, tanto desde el punto de vista terico como desde su aplicacin.
La interpretacin de un Diagrama de Pareto se puede definir completando las siguientes
oraciones de ejemplo:
Existen (nmero de categoras) contribuyentes relacionados con (efecto).
Pero estos (nmero de pocos vitales) corresponden al (nmero) % del total (efecto). Debemos
procurar estas (nmero) categoras pocos vitales, ya que representan la mayor ganancia
potencial para nuestros esfuerzos.
Relacin con otras herramientas
Un Diagrama de Pareto generalmente se relaciona con:
Ejemplo: Un fabricante de heladeras desea analizar cules son los defectos ms frecuentes que
aparecen en las unidades al salir de la lnea de produccin.
Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos:
55
Tipo de Defecto
Motor no detiene
No enfra
Burlete Def.
Pintura Def.
Rayas
No funciona
Puerta no cierra
Gavetas Def.
Motor no arranca
Mala Nivelacin
Puerta Def.
Otros
Posteriormente, un inspector revisa cada heladera a medida que sale de produccin registrando
sus defectos de acuerdo con dichos tipos.
Despus de inspeccionar 88 heladeras, se obtuvo una tabla como esta:
Tipo de Defecto
Frec.
Burlete Def.
Pintura Def.
Gavetas Def.
Mala Nivelacin
Motor no arranca
Motor no detiene
36
No enfra
27
No funciona
Otros
Puerta Def.
56
Puerta no cierra
Rayas
Total:
88
Pero Cules son los defectos que aparecen con mayor frecuencia? Para hacerlo ms
evidente, antes de graficar podemos ordenar los datos de la tabla en orden decreciente de
frecuencia:
no No
para
el
motor
alcanza 36
0.4091
detiene
Temperatura
0.4091
No enfra
27
0.3068
0.7159
Burlete Def.
0.1023
0.8182
Pintura Def.
0.0568
0.8750
Rayas
0.0455
0.9205
No funciona
0.0227
0.9432
0.0227
0.9659
Gavetas Def.
0.0114
0.9773
0.0114
nivelar
Motor
0.9886
arranca
parada
Puerta Def.
Puerta
0.0114
1.0000
de
refrigerador
no
cierra 0
0.0000
hermticamente
Otros
Total:
1.0000
0.0000
1.0000
1.0000
Vemos que la categora otros siempre debe ir al final, sin importar su valor. De esta manera, si
hubiese tenido un valor ms alto, igual debera haberse ubicado en la ltima fila.
57
Ahora resulta evidente cuales son los tipos de defectos ms frecuentes. Podemos observar
que los 3 primeros tipos de defectos se presentan en el 82 % de las heladeras,
aproximadamente. Por el Principio de Pareto, concluimos que: La mayor parte de los defectos
encontrados en el lote pertenece slo a 3 tipos de defectos, de manera que si se eliminan las
causas que los provocan desaparecera la mayor parte de los defectos.
1.5000
1.0000
0.5000
0.0000
1
11
Proporcin acum.
Incompetencias
698
0.477
0.477
Experiencia desequilibrada
314
0.215
0.692
236
0.161
0.853
111
0.076
0.929
Causas desconocidas
83
0.057
0.986
Otras causas
0.014
1.000
1463
1.000
Totales
1.5
1
0.5
0
1
58
83 64 91 70 77 86
120
100
80
60
40
20
0
0
10
15
20
25
1.8 Histograma.
1.8.1 Diagrama de barras.
En este tipo de grfica, sobre los valores de las variables se levantan barras estrechas de
longitudes proporcionales a las frecuencias correspondientes. Se utilizan para representar
variables cuantitativas discretas. Consiste en representar las cantidades con rectngulos de
igual base, y de altura proporcional a los valores respectivos. Los intervalos libres entre barras
tambin deben ser del mismo tamao, aunque a veces algunos autores las muestran pegadas.
59
datos y otra despus de la ltima. El resultado es que se "sujeta" la lnea por ambos extremos al
eje horizontal y lo que podra ser una lnea separada del eje se convierte, junto con ste, en un
polgono.
El siguiente ejemplo corresponde al porcentaje del PIB gastado en docencia e investigacin
durante el ao de 1990 en cinco pases (fuente: Revista "Ciencia y Desarrollo", 1994,
XIX(114):12):
1.8.3 Ojivas.
Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar
parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas,
existen las ojivas mayor que y las ojivas menor que.
60
Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por
sto la aplicacin de la tcnica es parcial):
Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el
extremo izquierdo; para la ojiva menor que, con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase.
Para el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,
utilizando los datos que se usaron para ejemplificar el histograma:
La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est
sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las
4:00 horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga,
en la ojiva menor que la frecuencia que se representa en cada frontera de clase son el nmero
de observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de
observaciones antes de la hora que seala la frontera).
61
62
escuela se les hacen una pruebas de sangre y el tipo sanguneo se puede clasificar en ocho
maneras. Puede ser AB, A, B u O, con un signo mas o uno menos, que dependen de la
presencia o ausencia del antgeno R h. la clasificacin de tipos sanguneos solo podemos tener
tantas observaciones como estudiantes haya en la escuela. El proyecto por tanto tiene como
resultados un numero finito de observaciones.
Sea x
, x 2, ..., x
probabilidad f (x). Definimos entonces a x 1 , x 2, ..., x n como una muestra aleatoria de tamao n
de la poblacin f(x) y escribimos su distribucin de probabilidad conjunta como:
F ( x1 , x2 ,..., xn ) = f ( x1 ) f ( x2 ),..., f ( xn )
La distribucin de probabilidad de una estadstica se llama distribucin muestral. La distribucin
de probabilidad de x se llama distribucin la media.
La distribucin muestral de una estadstica depende del tamao de la poblacin, el tamao de
las muestras y el mtodo de eleccin de las muestras.
Se debe ver las distribuciones mustrales de x y S2 como el mecanismo a partir del cual
haremos finalmente inferencias de los parmetros y 2.
Cuando las muestras son lo suficientemente grandes, se pueden hacer inferencias analticas
bastante extensas, con pocos y simples recursos, en comparacin con tcnicas ms refinadas
de la Estadstica. Esto es conveniente desde un punto de vista didctico.
La Teora del muestreo es el estudio de las relaciones entre una poblacin y las muestras que
se extraen de ella. Del anlisis de las muestras se pueden estimar o inferir datos de la poblacin
como su media ( ), varianza ( ), etc., llamados parmetros poblacionales. Cuando la
2
poblacin sea finita y de un tamao manejable en tiempo y costo, los valores poblacionales se
calculan directamente, sin necesidad del muestreo.
63
64
UNIDAD 2
PROBABILIDAD
Objetivo:
Conocer los conceptos bsicos
de probabilidad para aplicarlos
en la solucin de Problemas.
UNIDAD II / PROBABILIDAD.
C o n c e p to
E n fo q u e c la s ic o o
a p rio ri
E n fo q u e c o m o fre c u e n c ia re la tiv a o
a p o s te rio ri
Concepto clsico
Est basado en el concepto de resultados igualmente verosmiles y motivado por el
denominado Principio de la Razn Insuficiente, el cual postula que si no existe un
fundamento para preferir una entre varias posibilidades, todas deben ser consideradas
equiprobables.
As, en el lanzamiento de una moneda perfecta la probabilidad de cara debe ser igual que la
de cruz y, por tanto, ambas iguales a 1/2. De la misma manera, la probabilidad de cada uno
de los seis sucesos elementales asociados al lanzamiento de un dado debe ser 1/6. Laplace
recogi esta idea y formul la regla clsica del cociente entre casos favorables y casos
posibles, supuestos stos igualmente verosmiles.
El problema aqu surge porque en definitiva igualmente verosmil es lo mismo que
igualmente probable, es decir, se justifica la premisa con el resultado. Adems qu ocurre
66
UNIDAD II / PROBABILIDAD.
Concepto frecuentista
Es un hecho, empricamente comprobado, que la frecuencia relativa de un suceso tiende a
estabilizarse cuando la frecuencia total aumenta. Surge as el concepto frecuentista de la
probabilidad de un suceso como un nmero ideal al que converge su frecuencia relativa
cuando la frecuencia total tiende a infinito.
67
UNIDAD II / PROBABILIDAD.
As, solemos afirmar que la probabilidad de que salga un seis al tirar un dado es 1/6 porque
al hacer un gran nmero de tiradas su frecuencia relativa es aproximadamente esa. El
problema radica en que al no poder repetir la experiencia infinitas veces, la probabilidad de
un suceso ha de ser aproximada por su frecuencia relativa para un n suficientemente
grande, y cun grande es un n grande? 0, qu hacer con aquellas experiencias que solo
se pueden repetir una vez?
Si despus de n repeticiones de un experimento, donde n es muy grande, un suceso ocurre
h veces entonces la probabilidad del suceso es h / n. Esto tambin se llama la probabilidad
estimada o emprica, de un suceso se toma como la frecuencia relativa de ocurrencia del
suceso cuando el nmero de observaciones es muy grande.
Ejemplo: Si en 1000 tiradas de una moneda salen 529 caras, la frecuencia relativa de caras
es: 529/1000 = 0.529
P : A a [0,1]
Tal que:
Axioma 1: Para todo suceso A de A sea
P ( A) 0
i j,
debe ser
P U Ai = P ( Ai )
i =1 i =1
68
UNIDAD II / PROBABILIDAD.
Obsrvese que esta definicin no dice cmo asignar las probabilidades ni siquiera a los
sucesos elementales. Solo dice que cualquier asignacin que hagamos debe verificar estos
tres axiomas para que pueda llamarse Probabilidad.
69
UNIDAD II / PROBABILIDAD.
P : A a [0,1]
La cual asignar a cada suceso (elemento de A) un nmero entre cero y uno como medida
de su incertidumbre.
Advertimos no obstante, que la eleccin del espacio muestral asociado a un experimento
aleatorio no tiene por qu ser nica, sino que depender de que sucesos elementales
queramos considerar como distintos y del problema de la asignacin de la probabilidad
sobre esos sucesos elementales.
Problema: Liste los elementos de cada uno de los espacios mustrales siguientes:
a) El conjunto de enteros entre 1 y 50 divisibles entre 8
b) El conjunto S = {x | x 2 + 4x 5 = 0}
c)
Solucin:
a)
b)
S = {-5, 1}
70
UNIDAD II / PROBABILIDAD.
c)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
rectngulo. Tales diagramas denominados diagramas de Venn, sirven para darnos una
intuicin geomtrica respecto a las posibles relaciones entre conjuntos.
A B.
71
UNIDAD II / PROBABILIDAD.
72
UNIDAD II / PROBABILIDAD.
Anlisis combinatorio.
En muchos casos el nmero de puntos mustrales en un espacio muestral no es muy
grande y as la enumeracin o cuenta directa de los puntos del muestreo necesario para
obtener las probabilidades no es difcil. Sin embargo, surgen problemas cuando la cuenta
directa se convierte en una imposibilidad prctica. En tales casos se emplea el anlisis
combinatorio, que podra llamarse una forma sofisticada de contar.
Principio aditivo.
A menudo es ms fcil calcular la probabilidad de algn evento a partir del conocimiento de
las probabilidades de otros eventos. Esto puede ser cierto si el evento en cuestin se puede
representar como la unin de otros dos eventos o como el complemento de algn evento. A
continuacin se presenta varias leyes importantes que con frecuencia simplifica el clculo de
probabilidades. La primera regla aditiva se aplica a uniones de eventos.
Si se desea llevar a efecto una actividad, la cul tiene formas alternativas para ser realizada,
donde la primera de esas alternativas puede ser realizada de M maneras o formas, la
segunda alternativa puede realizarse de N maneras o formas ..... y la ltima de las
alternativas puede ser realizada de W maneras o formas, entonces esa actividad puede ser
llevada a cabo de,
M + N + .........+ W maneras o formas
73
UNIDAD II / PROBABILIDAD.
Problema: Una persona desea comprar una lavadora de ropa, para lo cual ha pensado que
puede seleccionar de entre las marcas Whirpool, Easy y General Electric, cuando acude a
hacer la compra se encuentra que la lavadora de la marca W se presenta en dos tipos de
carga ( 8 u 11 kilogramos), en cuatro colores diferentes y puede ser automtica o
semiautomtica, mientras que la lavadora de la marca E, se presenta en tres tipos de carga
(8, 11 o 15 kilogramos), en dos colores diferentes y puede ser automtica o semiautomtica
y la lavadora de la marca GE, se presenta en solo un tipo de carga, que es de 11
kilogramos, dos colores diferentes y solo hay semiautomtica. Cuntas maneras tiene esta
persona de comprar una lavadora?
Solucin:
M = Nmero de maneras de seleccionar una lavadora Whirpool
N = Nmero de maneras de seleccionar una lavadora de la marca Easy
W = Nmero de maneras de seleccionar una lavadora de la marca General Electric
M = 2 x 4 x 2 = 16 maneras
N = 3 x 2 x 2 = 12 maneras
W = 1 x 2 x 1 = 2 maneras
M + N + W = 16 + 12 + 2 = 30 maneras de seleccionar una lavadora
Problema: Rafael Luna desea ir a las Vegas o a Disneylandia en las prximas vacaciones
de verano, para ir a las Vegas l tiene tres medios de transporte para ir de Chihuahua al
Paso Texas y dos medios de transporte para ir del Paso a las Vegas, mientras que para ir
del paso a Disneylandia l tiene cuatro diferentes medios de transporte,
a) Cuntas maneras diferentes tiene Rafael de ir a las Vegas o a Disneylandia?,
b) Cuntas maneras tiene Rafael de ir a las Vegas o a Disneylandia en un viaje
redondo, si no se regresa en el mismo medio de transporte en que se fue?.
Solucin:
a) V = maneras de ir a las Vegas
D = maneras de ir a Disneylandia
V = 3 x 2 = 6 maneras
D = 3 x 4 = 12 maneras
V + D = 6 + 12 = 18 maneras de ir a las Vegas o a Disneylandia
74
UNIDAD II / PROBABILIDAD.
D = maneras de ir y regresar a
Disneylandia
V = 3 x 2 x 1 x 2 = 12 maneras
D = 3 x 4 x 3 x 2 = 72 maneras
V + D = 12 + 72 = 84 maneras de ir a las Vegas o a Disneylandia en un viaje redondo
Cmo podemos distinguir cuando hacer uso del principio multiplicativo y cuando del
aditivo?
Es muy simple, cuando se trata de una sola actividad, la cual requiere para ser llevada a
efecto de una serie de pasos, entonces haremos uso del principio multiplicativo y si la
actividad a desarrollar o a ser efectuada tiene alternativas para ser llevada a cabo, haremos
uso del principio aditivo.
Principio multiplicativo.
Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la
actividad a realizar puede ser llevado a cabo de N1 maneras o formas, el segundo paso de
N2 maneras o formas y el r-simo paso de Nr maneras o formas, entonces esta actividad
puede ser llevada a efecto de;
75
UNIDAD II / PROBABILIDAD.
Solucin:
Considerando 26 letras del abecedario y los dgitos del 0 al 9
a) 26 x 26 x 26 x 10 x 10 x 10 x 10 = 175,760,000 placas para automvil.
b) 26 x 25 x 24 x 10 x 9 x 8 x 7 = 78,624,000 placas para automvil
c) 1 x 25 x 24 x 1 x 9 x 8 x 7 = 302,400 placas para automvil
d) 1 x 1 x 24 x 10 x 9 x 8 x 7 = 120,960 placas para automvil
Problema: Cuntos nmeros telefnicos es posible disear, los que deben constar de seis
dgitos tomados del 0 al 9?,
a) Considere que el cero no puede ir al inicio de los nmeros y es posible repetir
dgitos,
b) El cero no debe ir en la primera posicin y no es posible repetir dgitos,
c) Cuntos de los nmeros telefnicos del inciso b empiezan por el nmero siete?,
d) Cuntos de los nmeros telefnicos del inciso b forman un nmero impar?.
Solucin:
a) 9 x 10 x 10 x 10 x 10 x 10 = 900,000 nmeros telefnicos
b)
76
UNIDAD II / PROBABILIDAD.
Problema: Un experimento consiste en lanzar una moneda y despus lanzarla una segunda
vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez.
Para listar los elementos del espacio muestral que proporciones mayor informacin.
77
UNIDAD II / PROBABILIDAD.
78
UNIDAD II / PROBABILIDAD.
Si contamos todas las ramas terminales, nos damos cuenta que el nmero de clasificaciones
son 2 x 4 x 3 = 24 mismas que podemos enumerar;
MAN, MAA, MAB, MBN, MBA, MBB, etc, etc.
Problema: Un producto (por ejemplo, hardware para un sistema de computadoras) se puede
embarcar a travs de cuatro aerolneas diferentes, y cada aerolnea puede transportar los
embarques por tres rutas distintas. Cuntas formas distintas de embarcar el producto
existen?
79
UNIDAD II / PROBABILIDAD.
En este diagrama se muestran que hay solo diez maneras de que se gane el torneo, que se
obtienen contando las ramas terminales de este diagrama de rbol, las que es posible
enumerar;
AA, ABB, ABAA, ABABA, ABABB, etc, etc.
3 x 2 x 1 = 6;
2 x 1 = 2.
Para abreviar estas expresiones, se usa una notacin especial llamada notacin factorial y
nos denota las multiplicaciones sucesivas de n hasta l y se define como:
4 x 3 x 2 x 1 = 4!
3 x 2 x 1 = 3!
Se leecuatro factorial
Se lee tres factorial
En trminos generales:
n(n-1)(n-2)...x 2 x 1 = n! Se lee n factorial
Propiedades:
a)
Ejemplo:
7! = 7 x 6! = 7 x 6 x 5 x 4!
0! = 1
5! = 5 x 4 x 3 x 2 x 1 = 120
4! 3! = (24)(6) = 144
8! 8 x7 x6 x5!
=
= 336
5!
5!
80
UNIDAD II / PROBABILIDAD.
n ! 2 n * n n .e n
2.3.3 Permutacin.
Una permutacin es un arreglo de todo o parte de un conjunto de objetos, el cual tiene una
disposicin de elementos en un orden especifico. Es todo arreglo de elementos en donde
nos interesa el lugar o posicin que ocupa cada uno de los elementos que constituyen dicho
arreglo.
Teorema :
Dado un conjunto de n elementos claramente distintos, se desea seleccionar r elementos de
los n y acomodarlos dentro de r posiciones.
El nmero de permutaciones diferentes de los n elementos tomados r a la vez se denota por
: n P r y es igual
n Pr
= n ( n 1 ) (n 2 ) . . . ( n r + 1 )
n Pr =
n!
( n r )!
P n = n ( n 1 ) (n 2 ) . . . 1 = n !
81
UNIDAD II / PROBABILIDAD.
La demostracin del teorema anterior es : hay n formas de ocupar la primera posicin. Una
vez que se ocupa, hay n 1 formas de ocupar la segunda, n 2 formas de ocupar la
tercera, . . . , y (n r + 1 ) formas de ocupar la n-sima posicin. Aplicaremos la regla de
multiplicativa para obtener
n
n!
(n r )
Problema: Hallar:
a) 8 P 3
b) 6 P 4
c) 15 P 1
d) 3 P 3
Solucin
a) 336
b) 360
c) 15
d) 6
Problema: El numero de ordenaciones o permutaciones diferentes que consisten de 3 letras
cada una y que puede formarse de las 7 letras A, B , C, D, E, F, G, es n = 7 & r = 3
7P3 = 210
Problema: Se quieren sentar 5 hombres y 4 mujeres en una fila de modo que las mujeres
ocupen los sitios pares de cuantas formas pueden sentarse?
Solucin:
( 5 P 5 ) ( 4 P 4 ) = 2880 formas
Problema: Cuantas representaciones diferentes sern posibles formar, si se desea que
consten de Presidente, Secretario, Tesorero, Primer Vocal y Segundo Vocal?, s esta
representacin puede ser formada de entre 25 miembros del sindicato de una pequea
empresa.
Solucin:
Por principio multiplicativo:
25 x 24 x 23 x 22 x 21 = 6,375,600 maneras
Por Frmula:
n = 25,
r=5
82
UNIDAD II / PROBABILIDAD.
25P5
Cuntas maneras diferentes hay de asignar los primeros tres premios de esta
carrera de frmula uno?
Solucin:
Por principio multiplicativo:
8 x 7 x 6 x 5 x 4 x 3 x 2 x 1= 40,320 maneras de asignar las posiciones de salida de los
autos participantes en la carrera
Por Frmula:
n = 8, r = 8
8P8=
......etc., etc.
a) Por principio multiplicativo:
8 x 7 x 6 = 336 maneras de asignar los tres primeros lugares de la carrera
Por frmula:
n =8, r = 3
8P3
83
UN
NIDAD II / PROBAB
BILIDAD.
Solucin:
a) Por frmula
n = 6,
6P3
r=3
= 6! / (6 3)! = 6!
6 / 3! = 6 x 5 x 4 x 3! / 3! = 6 x 5 x 4 = 120 puntoss posibles
4T
4T
2C
P3 = 3!
P4 = 4!
P4 = 4!
P2 = 2!
P4 = 4!
3! (4!) (4!) (2!) (4!) = 165888
os distintos de
d matemticcas, seis dife
erentes de fsica
f
y dos diferentes
d
Problema: Cuatro libro
a se colocan en un estantte. De cuantas formas distintas es posible orde
enarlos si
de qumica
a) loss libros de ca
ada asignaturra deben esttar todos junttos,
b) sollamente los libros
l
de mattemticas de
eben estar ju
untos?
Solucin
a) (4 P 4 ) (6 P 6 ) ( 2 P 2 ) ( 3 P 3 ) = 207360
b) (9 P 9 ) (4 P 4 ) = 8709120
Problema: Se sacan dos
d billetes de lotera d
de 20 para un
u primer y un segundo
o premios.
Encuentre el nmero de
e puntos mu
ustrales en el
e espacio S
Solucin:
20 P 2 = 380
84
UNIDAD II / PROBABILIDAD.
Problemas propuestos:
P1.- Un sistema de alarma de seguridad se activa y desactiva introduciendo el cdigo
numrico de tres dgitos apropiados en el orden correcto en un tablero digital.
a) Calcule el nmero total de posibles combinaciones del cdigo si ningn digito se
puede utilizar dos veces.
b) Calcule el numero total de posibles combinaciones del cdigo si los dgitos se puede
utilizar mas de una vez.
Solucin:
a) 10 P 3 = 720
b) (10)(10)(10) = 1000
85
UNIDAD II / PROBABILIDAD.
P2.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin llegar al ordenamiento final?
Solucin:
10 P 3 = 720
P3.- en una carrera de coches (50 coches) queremos saber el nmero de formas distintas en
que se pueden repartir los premios (primero, segundo y tercer lugar)
Solucin: 50 P 3 = 117600
P4.- Alguien desea colocar 6 cuadros en lnea recta sobre la pared de una biblioteca. De
cuantas maneras diferentes lo pueden hacer?
Solucin: 6P6 = 720
P5.- De cuantas maneras pueden 10 personas sentarse en una banca si solo hay 4
puestos disponibles?
Solucin: 10P4 = 5040
n!
n1!, n 2 !,..., n k !
Problemas: Obtenga todas las seales posibles que se pueden disear con seis banderines,
dos de los cuales son rojos, tres son verdes y uno morado.
Solucin:
n = 6 banderines; x1 = 2 banderines rojos; x2 = 3 banderines verdes; x3 = 1 bandern
morado
86
UNIDAD II / PROBABILIDAD.
6P2,3,1
Problema:
a) Cuntas claves de acceso a una computadora ser posible disear con los
nmeros 1,1,1,2,3,3,3,3?,
b) cuntas de las claves anteriores empiezan por un nmero uno seguido de un dos?,
c) cuntas de las claves del inciso a empiezan por el nmero dos y terminan por el
nmero tres?
Solucin:
a) n = 8 nmeros;
8P3,1,4
x1 = 3 nmeros uno;
x2 = 1 nmero dos;
x3 = 4 nmeros cuatro
x1 = 2 nmeros uno;
x2 = 4 nmeros tres
x1 = 3 nmeros uno;
x2 = 3 nmeros tres
87
UNIDAD II / PROBABILIDAD.
Solucin:
n = 9 rboles; x1 = 2 nogales; x2 = 4 manzanos; x3 = 3 ciruelos
9P2,4,3
= 12! / 7!3!2! = 7,920 maneras de que en la temporada este equipo logre siete
9!
= 1260
3!(4!)(2!)
Problema: Usted cuanta con 12 analista de sistemas y desea asignar tres al trabajo 1, cuatro
al trabajo 2 y cinco al trabajo 3. De cuantas formas distintas puede efectuar esta
asignacin?
Solucin:
n1 = 3, n2 = 4, n3 = 5
12!
= 27720
3!(4!)(5!)
Problema: Cuantas muestras de 4 juntas unidades por soldadura blanda de estao-plomo
se pueden seleccionar de un lote de 25 juntas de este tipo que estn disponibles para
pruebas de resistencia?
25!
= 12650
(4!)(21!)
88
UNIDAD II / PROBABILIDAD.
Pruebas ordenadas
Se le llama prueba ordenada al hecho de seleccionar r objetos de entre n objetos contenidos
en una urna uno tras otro. Una prueba ordenada puede ser llevada a efecto de dos maneras:
a) Con sustitucin (con reemplazo).- En este caso se procede a seleccionar el primer
objeto de entre los n que hay, se observa de qu tipo es y se procede a regresarlo a
la urna, luego se selecciona el siguiente objeto, lo anterior se repite hasta que se
han extrado los r objetos de la prueba, por tanto el nmero de pruebas ordenadas
de con sustitucin se obtiene:
Nmero total de pruebas ordenadas con sustitucin = n x n x n x .........x n = nr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, dado
que se ha regresado a la urna el primer objeto, tambin se tendrn n objetos y as
sucesivamente.
b) Sin sustitucin (sin reemplazo).- En este caso se procede a seleccionar el primer
objeto, el cual no es regresado a la urna, luego se selecciona el segundo objeto, lo
anterior se repite hasta completar los r objetos de la prueba, por lo que el nmero
total de pruebas ordenadas sin sustitucin se obtiene:
Nmero total de pruebas ordenadas sin sustitucin = n(n-1)(n-2).........(n-r +1) = nPr
Hay n maneras de seleccionar el primer objeto, luego al seleccionar el segundo objeto, hay
n 1 maneras, dado que el primer objeto no se regresa a la urna, luego cuando se extrae el
r-simo objeto, hay (n r +1) de que sea seleccionado.
Problema: Cuntas maneras hay de que se asignen tres premios de un sorteo en donde el
primer premio es una departamento, el segundo premio es un auto y el tercer premio es un
centro de cmputo, si los participantes en este sorteo son 120 personas,
a) s la asignacin se puede hacer con sustitucin,
b) s la asignacin se puede hacer sin sustitucin.
Solucin:
a) Por principio multiplicativo:
120 x 120 x 120 = 1,728,000 maneras de asignar los premios
Por frmula: n =120,
r = 120
89
UNIDAD II / PROBABILIDAD.
r=3
= 120! / (120 3)! = 120! / 117! = 120 x 119 x 118 = 1,685,040 maneras de asignar los
premios
Hay que hacer notar que en este caso, como los boletos que son seleccionados ya no
regresan a la urna de donde fueron extrados, los participantes solo pueden recibir un premio
en caso de que fueran de los afortunados. Esta es la forma en que generalmente se efecta
un sorteo.
Problema: Cuntas formas hay de asignar las primeras cinco posiciones de una carrera de
autos de frmula K, si participan 26 autos en esta carrera?. Considere que la asignacin es
totalmente al azar.
Solucin:
Esta asignacin debe ser sin sustitucin, esto es, se trata de una prueba ordenada sin
sustitucin, por lo que la solucin es la que se muestra.
n = 26,
26P5
r=5
90
UNIDAD II / PROBABILIDAD.
11P5
participacin
2.3.4 Combinaciones.
Como ya se mencion anteriormente, una combinacin, es un arreglo de elementos en
donde no nos interesa el lugar o posicin que ocupan los mismos dentro del arreglo. En una
combinacin nos interesa formar grupos y el contenido de los mismos.
Teorema
Se desea escoger una muestra de r elementos de un conjunto de n elementos. Entonces, el
numero de muestras distintas de r elementos que se pueden escoger de n se denota por
()
n
r
y es igual
n
= n Cr
r
n!
r!(n r)!
n
= n Cr
r
n!
r!(n r)!
Problema:
Hallar el valor de
a) 7 C4
b) 6 C 5
c) 4 C 4
Solucin:
a)
91
UNIDAD II / PROBABILIDAD.
C4 =
7!
= 35
4!(7 4)!
b)
6
C5 =
6!
=6
5!(6 5)!
c)
C4 =
4!
=1
4!(4 4)!
Cr =
8!
= 56
3!(8 3)!
Problema: De cuatro qumicos y tres fsicos encuentre el nmero de comits que se pueden
formar que consistan en dos qumicos y un fsico.
Solucin:
Qumico 4 C 2;
Fsico 3 C 1
3!
4!
=
2!(4 2)! 1!(3 1)!
( 4 C2 )( 3 C1 ) =
( 6 )( 3) = 18
92
UNIDAD II / PROBABILIDAD.
2002 grupos
b) n = 14 (8 mujeres y 6 hombres),
8C3*6C2
r=5
= 840
6C5* 8C0
= 15 x 8 + 6 x 1 = 120 + 6 = 126
r=9
10C7
= 1 x 120 = 120 maneras de seleccionar las 9 preguntas entre las que estn
3C1* 9C8
3C0* 9C9
+ 3C1* 9C8 = (1 x 1) + (3 x 9)
93
UNIDAD II / PROBABILIDAD.
r=5
Es decir que se pueden formar 462 grupos de cinco personas para ser invitadas a cenar.
b) Esta seora tiene dos alternativas para hacer la invitacin, la primera es no
invitar a la pareja y la segunda es invitar a la pareja.
2C0* 9C5
2C2* 9C3
= (1 x 126)
En este caso separamos a la pareja de los dems invitados para que efectivamente se
cumpla el que no asistan o que asistan a la cena.
c) La seora tiene dos alternativas para hacer la invitacin, una de ellas es que
no invitar a Rafael y a Arturo o que asista solo uno de ellos.
2C0* 9C5
= (1 x 126)
2C1* 9C4
(2 x 126)
94
UNIDAD II / PROBABILIDAD.
10C2
b) En este caso excluiremos los puntos A y B y a partir de los ocho puntos restantes se
obtendrn las lneas.
2C0* 8C2
1C1* 9C2
= (5 C 2) (6 C 2) = 150
c) 2 Mat. de un total de 3 3 C 2
3 Fis. de un total de 7 7 C 3 = (3 C 2) (7 C 3) = 105
Problema: De cuantas formas pueden 10 objetos dividirse en dos grupos de 4 y 6 objetos
respectivamente.
Solucin:
(10 C 4) = 210
95
UNIDAD II / PROBABILIDAD.
Problema: Cuantas manos diferentes de 5 naipes pueden darse con un mazo normal de 52
naipes, no importa el orden en que se reciban las cartas, lo que nos indica que se trata de
una combinacin.
Solucin:
52 C 5 = 2598960
Problema: Si 10 alumnos desean jugar baloncesto, cuntos equipos diferentes pueden
formarse con estos jugadores ? , uno de los muchachos se llama Jos. Solo se desea contar
los equipos que incluyen a Jose
Solucin:
10 C 5 = 252 equipos diferentes
El nmero de equipos que incluyen a Jos son:
9 C 4 = 126
Problema: cuntas parejas distintas pueden formarse con cinco individuos?
Solucin:
5 C 2 = 10
Particiones ordenadas.
Se le llama particin ordenada al hecho de repartir n objetos en clulas de una cantidad de
x1 objetos, x2 objetos,......y xk objetos.
Problema: Cuntas maneras hay de repartir 10 libros diferentes entre tres alumnos, si al
primero le daremos 2, al segundo 3 y el resto al tercer alumno? , esta particin seran las
siguientes si se numeran los libros del 1 al 10;
Solucin:
Lo primero que debemos hacer es seleccionar 2 libros de los 10 que se tienen para el primer
alumno, esto es;
10C2
Y por ltimo se proceder a seleccionar cinco libros de los cinco que quedan para el tercer
alumno, lo que se muestra a continuacin;
96
UNIDAD II / PROBABILIDAD.
5C5
= 2520
La expresin anterior nos recuerda a la frmula utilizada para encontrar las permutaciones
de n objetos, entre los cuales hay algunos objetos que son iguales, por lo que usaremos la
misma frmula para encontrar las particiones ordenadas.
Por tanto la frmula para las particiones ordenadas sera:
nPx1 , x2 .........., xk =
n!
x1! x2 !.......xk !
Esta frmula slo puede ser utilizada cuando se reparten todos los objetos, no parte de
ellos, en ese caso se usarn combinaciones.
Donde:
nPx1,x2,.....,xk = Total de particiones ordenadas o reparticiones que es posible hacer cuando
los n objetos son repartidos en grupos de x1 objetos, x2 objetos ...... y xk objetos.
n = x1 + x2 + ......+ xk
Problema: Cuntas maneras hay de repartir 9 juguetes entre tres nios, si se desea que al
primer nio le toquen 4 juguetes, al segundo 2 y al tercero 3 juguetes?
Solucin:
Por combinaciones,
9C4* 5C2* 3C3
Por frmula,
n = 9; x1 = 4; x2 = 2; x3 =3
9P4,2,3
Problema: Cuntas maneras hay de repartir los mismos 9 juguetes entre tres nios, si se
desea darle 3 al primer nio, 2 al segundo nio y 2 al tercer nio?
97
UNIDAD II / PROBABILIDAD.
Solucin:
En este caso nicamente se puede dar solucin por combinaciones, ya que no es posible
usar la frmula debido a que se reparten solo parte de los juguetes.
9C3* 6C2* 4C2
b) Por combinaciones:
14C5* 9C3* 6C2
de 5, 3 y 2 libros
Problema:
a) Cuntas maneras hay de repartir a 12 alumnos en 4 equipos de 3 personas cada
uno de ellos para que realicen prcticas de laboratorio diferentes?,
b) Cuantas maneras hay de que se repartan los 12 alumnos en 4 equipos de 3
personas si se va a realizar una misma prctica?
Solucin:
a) En este caso al ser prcticas de laboratorio diferentes, es posible resolver el
problema por combinaciones o por la frmula, dado que se reparten todos los
alumnos
Por frmula:
n = 12; x1 = 3 prctica 1; x2 = 3 prctica 2; x3 = 3 prctica 3; x4 = 3 prctica 4
98
UNIDAD II / PROBABILIDAD.
12P3,3,3,3
12P3,3,3,3
Ejercicios propuestos:
P1.- Se contrata un servicio de calificacin de computadoras para encontrar las tres mejore
marcas de monitores EGA. Se incluir un total de 10 marcas en el estudio. De cuantas
formas distintas puede el servicio de calificacin pero no debe poner los tres en ningn
orden?
Solucin:
10 C 3 = 120
P2.- cuntas parejas distintas pueden formarse con cinco individuos?
Solucin.
5 C 2 = 10
P3.- Con 5 estadistas y 6 economistas quiere formarse un comit de 3 estadistas y 2
economistas. Cuntos comits diferentes pueden formarse si:
a)no se impone ninguna restriccin ,
b)dos estadistas determinados deben estar en el comit
c)un economista determinado no debe estar en el comit?
Solucin:
a) 150
b) 45
c) 100
P4.- Suponga que necesita reemplazar 5 empaques en un dispositivo que funciona con
energa nuclear. Si tiene una caja con 20 empaques de entre los cuales escoger, cuantas
elecciones diferentes son posibles? Es decir, cuantas muestras distintas de 5 empaques se
pueden seleccionar de los 20 ?
Solucin:
20C5 = 15,504
99
UNIDAD II / PROBABILIDAD.
2.4.1 Axiomas.
Axioma 1: para cada suceso a en la clase C
P(A) 0
P(S) =1
2.4.2 Teoremas.
Teorema 1 . si A1 A2 entonces P (A1) P( A2) y P( A2 - A1) = P( A2 ) P (A1)
Teorema 2. para cada suceso A 0 P ( A) 1 es decir la probabilidad de un suceso entre 0
y 1.
Teorema 3. P ( ) = 0 es decir el suceso imposible tiene probabilidad cero.
Teorema 4. si A es el complemento de A entonces
P(A)=1p(A)
100
UNIDAD II / PROBABILIDAD.
2.5.1 Dependiente.
Hay ocasiones en que nos interesa alterar nuestra estimacin de la probabilidad de un
evento cuando poseemos informacin adicional que podra afectar el resultado. Esta
probabilidad modificada se denomina probabilidad condicional del evento.
La probabilidad de que un evento B ocurra cuando se sabe que ya ocurri algn evento A se
llama probabilidad condicional y se denota por P(B A ). El smbolo P(B A ) por lo
general se lee la probabilidad de que ocurra B dado que ocurri A o simplemente la
probabilidad de B, dado A.
P(A B ) =
P( A B )
P (B )
p( A | E ) =
p( A E )
p( E )
Donde:
p(AE) = probabilidad de que ocurra A dado que E ya ocurri; p(AE) = probabilidad de que
ocurra A y E a un mismo tiempo; p(E) = probabilidad de que ocurra E
101
UNIDAD II / PROBABILIDAD.
Luego;
P( A E ) =
A E
P( E ) =
Por tanto:
P( A | E ) =
A E
E
Donde:
AE= nmero de elementos comunes a los eventos A y E
E= nmero de elementos del evento E
Luego entonces podemos usar cualquiera de las dos frmulas para calcular la probabilidad
condicional de A dado que E ya ocurri.
Si la ocurrencia o no de E1 no afecta para nada la probabilidad de ocurrencia de E2 ,
entonces : Pr { E2 E1 } = P { E2 }, y diremos que E1 y E2 son sucesos independientes; en
caso contrario, se dir que son casos dependientes.
Si denotamos por E1 E2 el suceso de que ambos E1 y E2 ocurran, llamado un suceso
compuesto, entonces
Pr {E1 E2 } = Pr {E1 } Pr { E2 E1 }
En particular,
Pr {E1 E2 } = Pr {E1 } Pr { E2 }
Problema: La probabilidad de que un vuelo programado normalmente salga a tiempo es
P(D) = 0.83; la probabilidad de que llegue a tiempo es P ( A ) 0 0.82; y la probabilidad de que
salga y llegue a tiempo es P ( D A ) = 0.78. Encuentre la probabilidad de que un avin
a)
b)
Solucin:
a)
P ( A | D) =
P( D A) 0.78
=
= 0.94
P ( D)
0.83
102
UNIDAD II / PROBABILIDAD.
P ( D | A) =
P ( D A) 0.78
=
= 0.95
P ( A)
0.82
son sucesos
103
UNIDAD II / PROBABILIDAD.
Solucin:
Pr (E1 ) = 4 / 52 = 1/13
Pr (E2 ) = 4/52 = 1/13
Pr (E1 + E2 ) = 1 / 13 + 1/13 = 2 / 13
Problema: Una bola se extrae aleatoriamente de una caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Determinar la probabilidad de que sea a) roja, b) blanca, c)
azul, d) no roja, e) roja o azul.
Solucin:
a) pr ( roja ) = 6 / ( 6 + 4 + 5 ) = 6 / 15 = 2/5
b)
Pr ( blanca = 4 / 15
c)
E2 = 1, 2, 3 o 4
Pr (E1 E2 ) = Pr (E1 )
Pr ( E2 E1 ) = Pr (E1 ) P (E2 ) = (3/6)(4/6) = 1/3
Problema: Se extraen tres bolas sucesivamente de la caja que contiene 6 bolas rojas, 4
bolas blancas y 5 bolas azules. Hallar la probabilidad de que se extraigan en el orden roja,
blanca y azul si las bolas , a) se remplazan, b) no se remplazan.
Solucin:
a)
pr ( se remplazan ) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 6 + 4 + 5 )] [5 / ( 6 + 4 + 5 ) ] = 8/225
104
UNIDAD II / PROBABILIDAD.
Pr ( no se remplazan) = [6 / ( 6 + 4 + 5 ) ] [4 / ( 5 + 4 + 5 )] [5 / ( 5 + 3 + 5 ) ] = 4/91
b)
Solucin:
El espacio muestral es el mismo que cuando se lanza un dado dos veces y se muestra a
continuacin;
(1,1) (2,1) (3,1) (4,1) (5,1) (6,1)
(1,2) (2,2) (3,2) (4,2) (5,2) (6,2)
= (1,3) (2,3) (3,3) (4,3) (5,3) (6,3)
(1,4) (2,4) (3,4) (4,4) (5,4) (6,4)
(1,5) (2,5) (3,5) (4,5) (5,5) (6,5)
(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
a) Para calcular una probabilidad condicional es necesario definir los eventos A y E,
siendo estos,
A = evento de que en el segundo dado aparezca el nmero cuatro,
E = evento de que la suma de los nmeros que aparecen sea de por lo menos siete, (que es
que es el evento que est condicionando)
E = {21 elementos, los que suman siete o ms}
E=
(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = {6 elementos, los que en el segundo dado aparece el cuatro}
105
UNIDAD II / PROBABILIDAD.
E=
(2,5) (3,5) (4,5) (5,5) (6,5)(1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = evento de que ambos nmeros sean pares
A = (2,2) (4,2) (6,2) (2,4) (4,4) (6,4) (2,6) (4,6) (6,6)
AE = (6,2) (4,4) (6,4) (2,6) (4,6) (6,6)
AE=6 elementos
E=
(2,5) (3,5) (4,5) (5,5) (6,5) (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)
A = evento de que en el primer dado aparezca el nmero dos
A = (2,1) (2,2) (2,3) (2,4) (2,5)
AE = {(2,5)},
(2,6)
AE= 1 elemento
= 0.04762
Problema: Se seleccionan al azar dos nmeros de entre los nmeros del 1 al 9, si la suma
de los nmeros que aparecen es par,
a) Determine la probabilidad de que ambos nmeros sean pares,
b) Determine la probabilidad de que ambos nmeros sean impares.
Solucin:
106
UNIDAD II / PROBABILIDAD.
Problema: Dada la siguiente tabla referente a la produccin de flechas para camin de carga
pesada; se inspeccionan 200 flechas del tipo A y B, 300 del tipo C y 400 del tipo D, a
continuacin se presentan los resultados obtenidos en la inspeccin;
107
UNIDAD II / PROBABILIDAD.
Tipo flecha
DEFECTO A
TOTAL
54
23
40
15
132
II
28
12
14
59
S - DEF
118
165 246
380 909
TOTAL
200
200 300
400 1100
a) Si se selecciona una flecha al azar y resulta que es una flecha del tipo B, cul es la
probabilidad de que no tenga defectos,
b)
108
UNIDAD II / PROBABILIDAD.
109
UNIDAD II / PROBABILIDAD.
2.5.2 independientes.
Se dice que un evento B es independiente de un evento A, si p(BA) = p(B), esto quiere
decir que la probabilidad de que ocurra B no es afectada por la ocurrencia del evento A, la
expresin anterior se puede sustituir en el teorema de la multiplicacin para probabilidad
condicional,
p(AB) = p(A)p(BA) = p(A)p(B)
Luego,
p(AB) = p(A)p(B)
Concepto de independencia
Si la expresin anterior se cumple, podemos decir que los eventos A y B son
independientes.
Problema: Pruebas repetidas e independientes.
110
UNIDAD II / PROBABILIDAD.
Problema: Un boxeador gana 8 de cada 10 peleas en las que compite, si este boxeador
participar en tres peleas en los prximos seis meses, determine la probabilidad de que;
a) Gane dos de las peleas
111
UNIDAD II / PROBABILIDAD.
b) Si gana dos de las peleas, cul es la probabilidad de que sean la primera y tercera
peleas?,
c) Gane la segunda pelea.
Solucin: ={GGG. GGP, GPG, GPP, PGG, PGP, PPG, PPP}
a) p(gane dos de las peleas) = p(GGP, GPG, PGG)
= (0.8)(0.8)(0.2) + (0.8)(0.2)(0.8) + (0.2)(0.8)(0.8) = 0.128 + 0.128 + 0.128 = 0.384
b) E = evento de que gane dos peleas.
E ={ GGP, GPG, PGG }, p(E) = 0.348
A = evento de que gane la primera y la tercer pelea
A={GGG, GPG}
AB = {GPG},
112
UNIDAD II / PROBABILIDAD.
p(E) =11/24
Es decir,
U An = y
Ai
I Aj = para toda i j
B A es P ( B ) = P( B | An ) * P( An ) .
n
P(ojos claros) = P(A) P(ojos claros/A) + P(B) P(ojos claros/B) + P(C) P(0jos claros/C )
= 0'3 0'2 + 0'1 0'4 + 0'6 0'05 = 0'13.
113
UNIDAD II / PROBABILIDAD.
Teorema de Bayes
El siguiente teorema es un resultado con una gran carga filosfica detrs, el cual mide el
cambio que se va produciendo en las probabilidades de los sucesos a medida que vamos
haciendo observaciones. Paradjicamente a su importancia, su demostracin no es ms que
la aplicacin de la definicin de probabilidad condicionada seguida de la aplicacin del
teorema de la probabilidad total.
Teorema:
Sea un espacio probabilstico (, A, P) y
{ An } A
B A
P( Ai | B ) =
P ( Ai ) P ( B | Ai )
P( An ) P( B | An )
n
Este teorema tiene una interpretacin intuitiva muy interesante. Si las cosas que pueden
ocurrir las tenemos clasificadas en los sucesos Ai de los cuales conocemos sus
probabilidaes P(Ai), denominadas a priori, y se observa un suceso B, la frmula de Bayes
nos da las probabilidades a posteriori de los sucesos A<SUB<I< sub>, ajustadas o
modificadas por B.
Problema: Supongamos que tenemos una urna delante de nosotros de la cual solo
conocemos que o es la urna A1 con 3 bolas blancas y 1 negra, o es la urna A2 con 3 bolas
negras y 1 blanca. Con objeto de obtener ms informacin acerca de cual urna tenemos
delante, realizamos un experimento consistente en extraer una bola de la urna desconocida.
Si suponemos que la bola extraida result blanca 1B y a priori ninguna de las dos urnas es
ms verosmil que la otra, P(A1) = P(A2) = 1/2, entonces la frmula de Bayes nos dice que las
probabilidades a posteriori de cada urna son
P(A1/1B) =3/4 y P(A2/1B) =1/4
Habiendo alterado de esta forma nuestra creencia sobre la urna que tenemos delante: Antes
creamos que eran equiprobables y ahora creemos que es tres veces ms probable que la
urna desconocida sea la A1.
114
UNIDAD II / PROBABILIDAD.
115
UNIDAD II / PROBABILIDAD.
Problema:
P ( E) = 600/900 = 2/3 ; P (A E) = 36/600 = 3/50
P ( E ) = 1/3
P ( AE ) = 12/300 = 1/25
Teorema 2.6.1.
Si los eventos B
,B
, ..., B
P(Bi ) 0
para i = 1, 2, ..., k, , entonces para cualquier evento A de S,
k
i =1
i =1
P ( A) = P ( Bi A) = P ( Bi )( A | Bi )
116
UNIDAD II / PROBABILIDAD.
P ( B3 | A) =
P ( B3 ) P ( A | B3 )
P ( B1 ) P ( A | B1 ) + P ( B2 ) P( A | B2 ) + P( B3 ) P ( A | B3 )
P( B3 | A) =
0.005
0.005 10
=
=
0.006 + 0.0135 + 0.005 0.0245 49
En vista del hecho de que se selecciono un producto defectuoso, este resultado sugiere que
probablemente no fue hecho con la maquina B 3.
Problema: Tres mquinas denominadas A, B y C, producen un 43%, 26% y 31% de la
produccin total de una empresa respectivamente, se ha detectado que un 8%, 2% y 1.6%
del producto manufacturado por estas mquinas es defectuoso,
a) Se selecciona un producto al azar y se encuentra que es defectuoso, cul es la
probabilidad de que el producto haya sido fabricado en la mquina B?,
b) Si el producto seleccionado resulta que no es defectuoso, cul es la probabilidad de que
haya sido fabricado en la mquina C?
Solucin:
117
UNIDAD II / PROBABILIDAD.
P( B | D) =
P( B) P( D | B)
P( A) P( D | A) + P ( B) P ( D | B ) + P(C ) P( D | C )
P( B | D) =
0.26(0.02)
0.0052
=
= 0.116697
0.43(0.08) + 0.26(0.02) + 0.31(0.016) 0.04456
P (C | ND) =
P( B | D) =
P(C ) P ( ND | C )
P ( A) P ( ND | A) + P( B ) P( ND | B ) + P (C ) P( ND | C )
0.31(0.984)
0.30504
=
= 0.31927
0.43(0.92) + 0.26(0.98) + 0.31(0.984) 0.95544
Problema: Una empresa recibe visitantes en sus instalaciones y los hospeda en cualquiera
de tres hoteles de la ciudad; Palacio del Sol, Sicomoros o Fiesta Inn, en una proporcin de
118
UNIDAD II / PROBABILIDAD.
18.5%, 32% y 49.5% respectivamente, de los cuales se ha tenido informacin de que se les
ha dado un mal servicio en un 2.8%, 1% y 4% respectivamente,
a)
b)
c)
PS = evento de que un
visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicmoro;
P ( NQ ) = P ( PS ) P ( NQ | PS ) + P ( S ) P ( NQ | S ) + P ( FI ) P ( NQ | FI )
P ( NQ ) = 0.185(0.972) + 0.32(0.99) + 0.495(0.96) = 0.97182
b) NQ = evento de que un visitante no se queje del servicio; PS = evento de que un
visitante haya sido hospedado en el hotel Palacio del Sol; S = evento de que un
visitante haya sido hospedado en el hotel Sicomoro; FI = evento de que un visitante
haya sido hospedado en el hotel Fiesta Inn
119
UNIDAD II / PROBABILIDAD.
P ( PS | NQ) =
0.185(0.972)
0.17982
=
= 0.1850342
0.185(0.972) + 0.32(0.99) + 0.495(0.96) 0.97182
P ( FI | Q) =
0.495(0.04)
0.0198
=
= 0.7026
0.185(0.028) + 0.32(0.01) + 0.495(0.04) 0.0.02818
120
UNIDAD 3
FUNCIONES Y
DISTRIBUCIONES
MUESTRALES.
Objetivo:
Establecer las distribuciones de
probabilidad, basndose en datos
de situaciones reales o simuladas
que impliquen eventos aleatorios.
Centrar
su
estudio
distribuciones
Hipergeomtrica,
en
las
Binomial,
Poisson,
Definicin
Una variable aleatoria es una funcin que asocia un numero real con cada elemento del
espacio muestral.
Ejemplo: supngase que se lanza una moneda dos veces de tal forma que el espacio
muestral es S = {SS, SA, AS, AA }.
Represntese por X el nmero de sol que puede resultar.
Punto muestral
SS
SA
AS
AA
Ejemplo: se sacan dos bolas de manera sucesiva sin reemplazo de una urna que contiene
cuatro bolas rojas y tres negras. Los posibles resultados y los valores x de la variable
aleatoria. x el numero de bolas rojas, son
Punto muestral RR
X
RB
BR
BB
122
Definicin
Si un espacio muestral contiene un numero finito de posibilidades o una serie interminable
con tantos elementos como nmeros enteros existen, se llama espacio muestral discreto.
P ( a < x < b) ,
P (W > c ) ,
123
En los experimentos que tienen este tipo de distribucin, siempre se esperan dos
tipos de resultados, ejem. Defectuoso, no defectuoso, pasa, no pasa, etc, etc.,
denominados arbitrariamente xito (que es lo que se espera que ocurra) o
fracaso (lo contrario del xito).
b)
c)
Cada uno de los ensayos o repeticiones del experimento son independientes entre
s.
d)
n
n!
p xq n x
P ( X = x) = p xq n x =
x! ( n x )!
x
x = 0,1,2,..., n
Donde:
p = probabilidad de xito en una sola prueba; q = 1 p (probabilidad de fracaso)
n = nmero de pruebas; x = numero de xitos en n pruebas. La media y la varianza de la
variable Binomial son, respectivamente,
= np
2 = npq
Problema: Hallar la probabilidad de que al lanzar una moneda tres veces resulten (a) tres
sol; (b) dos guilas y un sol; (c) al menos un sol ; ( d) no ms de una guila.
124
Solucin:
Puede ocurrir 2 posibilidades (sol o guila ) por cada lanzamiento hay un total de
( 2) ( 2) (2) = 8 resultados posibles.
S = { SSS, SSA, SAS, ASS, SAA, ASA, AAS, AAA}
P(caiga un sol en una sola tirada) = p =
P(no caiga sol en una sola tirada) = q = 1 p =
(a) p( tres sol )
n=3yx=3
dbinom 3 , 3 ,
nx=33=0
= 0.125
= 0.375
= 0.875
n=3;x=1;nx=31=2
1
+ dbinom 1 , 3 , = 0.5
2
2
125
x=5
5
dos veces
b)
c)
Solucin:
p = 1/6; q = 1 p = 5/6
a)
n=5;x=2
x= 0 , 1
126
p =1/6
X=0
q = 5/6
p = 1/6
q = 5/6
b)
Solucin:
127
n = 6 y p = 0,2
128
c) x < 3; p = 0.1; n = 5
b(x = 0,1,2, n = 5, p = 0.1) = 0.9914
seleccionamos n artculos.
k N k
x n x ( k Cx )( N k Cn x )
=
h(x, N , n, k ) =
N
N Cn
n
x = 0,1,2,..., n
Problema: Se selecciona al azar un comit de cinco personas entre tres qumicos y cinco
fsicos. Encuentre la distribucin de probabilidad para el nmero de qumicos en el comit.
Solucin:
P ( x = 0) = h(0,8,5,3) =
P ( x = 1) = h(1,8,5,3) =
( 3 C0 )( 5 C5 )
= 0.0179
8 C5
( 3 C1 )( 5 C4 )
= 0.2679
8 C5
129
P ( x = 2) = h(2,8,5,3) =
( 3 C2 )( 5 C3 )
= 0.5357
8 C5
P ( x = 3) = h(3,8,5,3) =
( 3 C3 )( 5 C2 )
= 0.1786
8 C5
h (x, N, n k)
0.0179
0.2679
0.5357
0.1786
Problema: Lotes de 40 componentes cada uno se denomina aceptables sino contienen mas
de tres defectuosos. El procedimiento para muestrear el lote es la seleccin de cinco
componentes al azar y rechazar el lote si se encuentra un componente defectuoso. cual es
la probabilidad de que se encuentre exactamente un defectuoso en la muestra si hay tres
defectuosos en todo el lote ?
Solucin:
N = 40, n = 5; k = 3; x = 1
h(1, 40,5,3) =
( 3 C1 )( 37 C4 )
= 0.3011
40 C5
Problema: Una caja contiene 6 bolas blancas y 4 rojas. Se realiza un experimento en el cual
se selecciona una bola aleatoriamente y se observa su color, pero no se reemplaza la bola.
Hallar la probabilidad de que despus de 5 pruebas del experimento se haya escogido 3
bolas blancas.
N = 10; n = 5; x = 3; k = 6
h(3,10,5, 6) =
( 6 C3 )( 4 C2 )
= 0.4762
10 C5
130
muestreo es grande (10%) tenemos una variable aleatoria Hipergeomtrica. Los parmetros
son: N = 40, k = 8, n = 4, x es el numero de defectuosos en la muestra y queremos la
probabilidad p ( x > 2)
Solucin:
P ( x > 2 ) = p (x = 3) + p(x = 4) = h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.0204
Problema: Esta es la probabilidad de rechazar un lote con 25 % de defectuosos y es muy
baja. Para mejorar el proceso de seleccin, los ingenieros deciden rechazar el lote cuando
haya 2 o mas defectuosos. Cul es la probabilidad de rechazar un lote que tenga 8
defectuosos? Los parmetros permanecen iguales lo que cambia es la probabilidad ahora
es: p ( x 2 ) = p (x = 2) + p ( x > 2)
Solucin:
N = 40 ; n = 4, k = 8 ; x 2
p ( x 2 ) = p (x = 2) + p (x = 3) + p(x = 4)]
= h ( 2; 40, 4, 8) + h ( 3; 40, 4, 8) + h ( 4 ; 40, 4, 8) = 0.1723
Problema: Con esta nueva poltica de rechazar el lote cuando sean 2 o ms cul es la
probabilidad de rechazar un lote con 6 defectuosos? los parmetros son, ahora N = 40, k =
6; n = 4 y queremos la probabilidad:
p (x > 10 ) = 1 - [ p (x = 0) + p ( x = 1)] = 1 [ h (0 , 40, 4, 6) + h ( 1,40, 4,6)]=
= 1 ( 0.5075 + 0.3929 ) = 0.0996
Problema: En el saln de tercer ao de una escuela hay 35 alumnos, de los cuales 10 son
nias y 25 nios. Se nombra un comit de 7 alumnos que represente al saln. La seleccin
se hace al azar. que probabilidad hay de que en el comit haya mayora de nias? En
situaciones se cumple las hiptesis de una Hipergeomtrica. Los parmetros son : N = 35,
k = 10, n = 7, x es el numero de nias en el comit. La probabilidad pedida es:
P (x > 3 ) = p (x = 4) + p (x = 5) + p (x = 6) + p (x = 7)
Solucin:
=h(4,35,7,10)+h(5,35,7,10)+ (6,35,7,10)+h(7,35,7,10)
= 0.0718 + 0.0112 + 7.8072 x 10 4 + 1.7845 x 10 5 = 0.0838
131
132
p ( x, ) =
e
x!
x = 0, 1, 2, ...
donde :
2 =
Problema: Supongamos que el numero de grietas por espcimen de concreto con cierto tipo
de mezcla de cemento tiene una distribucin de probabilidad de Poisson aproximada.
Adems, suponga que el nmero medio de grietas por espcimen es de 2.5.
a) Calcule la media y la desviacin estndar de x, el numero de grietas por espcimen
de concreto.
b) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga
exactamente cinco grietas.
c) Calcule la probabilidad de que un espcimen de concreto escogido al azar tenga dos
o mas grietas.
Solucin:
a) Tanto la media como la varianza de una variable aleatoria de Poisson son iguales a
Por tanto,
= = 2.5
2 = = 2 .5
= 2.5 = 1.58
b) Queremos conocer la probabilidad de que un espcimen de concreto tenga
exactamente cinco grietas. La distribucin de probabilidad de x
= 2.5
x = 5;
2.5 5 e 2.5
p(5) =
= 0.067
5!
c) Para determinar la probabilidad de que un espcimen de concreto tenga o mas
grietas necesitamos calcular
133
p ( x 2) = p (2 ) + p (3) + p (4 ) + ... = p ( x )
x=2
p ( x 2 ) = 1 p ( x < 2)
= 1 [ p(0) + p(1)]
= 1 0.287 = 0.713
Problema: Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las
probabilidades de que reciba,
a) cuatro cheques sin fondo en un da dado,
b)
Solucin:
a)
x = variable que nos define el nmero de cheques sin fondo que llegan al banco en un
134
Solucin:
a) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 3
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata
P( 1, 0.6) = 0.3293
b) x = variable que nos define el nmero de imperfecciones en la hojalata por cada 5
minutos = 0, 1, 2, 3, ...., etc., etc.
= 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata
p( x = 0,1, = 3) = p( x = 0, = 3) + p( x = 1, = 3)
= 0.0498 + 0.1494 = 0.1992
Problema: Durante un experimento de laboratorio el nmero promedio de partculas
radiactivas que pasan a travs de un contador en un milisegundo es cuatro cul es la
probabilidad de que seis partculas entren al contador en un milisegundo dado?
t = 4; x = 6
6
(
4) e4
f ( x) =
6!
= 0.1042
p( x ,n , p )= n Cx p q
x
n x
x!
135
p( x , ) =
x
x!
Donde:
= = n p = nmero esperado de xitos = tasa promedio de xitos; n = nmero de
repeticiones del experimento; p = probabilidad de xito = p(xito)
Una regla general aceptable es emplear esta aproximacin si n 20 y p 0.05: s n 100, la
aproximacin es generalmente excelente siempre y cuando n p 10.
Problema: Se sabe que el 5% de los libros encuadernados en cierto taller tienen
encuadernaciones defectuosas. Determine la probabilidad de que 2 de 100 libros
encuadernados en ese taller, tengan encuadernaciones defectuosas, usando,
a) la frmula de la distribucin Binomial,
b) la aproximacin de Poisson a la distribucin Binomial.
Solucin:
a) n = 100
p = 0.05 = p(encuadernacin defectuosa) = p(xito)
q = 0.95 = p(encuadernacin no defectuosa) = p(fracaso)
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas
p(x = 2, n = 100, p = 0.05 ) = 0.0812
b) n = 100 encuadernaciones
p = 0.05
= n p = (100)(0.05)= 5
x = variable que nos define el nmero de encuadernaciones defectuosas en la muestra =
= 0, 1, 2, 3,....,100 encuadernaciones defectuosas
p(2, 5) = 0.0843
136
Al comparar los resultados de las probabilidades con una y otra distribucin, nos damos
cuenta de que la diferencia entre un clculo y otro es de tan solo 0.0031, por lo que la
aproximacin de Poisson es una buena opcin para calcular probabilidades Binomiales.
Problema: Un fabricante de maquinaria pesada tiene instalados en el campo 3840
generadores de gran tamao con garanta. S la probabilidad de que cualquiera de ellos falle
durante el ao dado es de 1/1200 determine la probabilidad de que
a) 4 generadores fallen durante el ao en cuestin,
b) que ms 1 de un generador falle durante el ao en cuestin.
Solucin:
a) n = 3840 generadores
p = 1/1200 = probabilidad de que un generador falle durante el ao de garanta
= n p = (3840)(1/1200) = 3.2 motores en promedio pueden fallar en el ao de garanta
x = variable que nos define el nmero de motores que pueden fallar en el ao de garanta =
0, 1, 2, 3,....,3840 motores que pueden fallar en el ao de garanta
dpois ( 4 , 3.2) = 0.1781
b) P ( x > 1) = 1 p ( x 1)
1 ( dpois ( 0 , 3.2) + dpois ( 1 , 3.2) ) = 0.8288
137
= n p = 0.1 (10) = 1 ; x = 2
dpois ( 2 , 1) = 0.1839
Problema: Si la probabilidad de que un individuo sufra una reaccin negativa ante una
inyeccin de cierto suero es 0.001, hallar la probabilidad de que entre 2000 individuos:
(a) exactamente 3 ;
(b) mas de 2 de ellos reaccionen negativamente.
Solucin:
= N p = (2000) ( 0.001) = 2
(a) P r{3 individuos reaccionen negativamente} =
dpois ( 3 , 2) = 0.1804
(b)
= 1 P r(0 1 2 lo sufran)
1 ( dpois ( 0 , 2) + dpois ( 1 , 2) + dpois ( 2 , 2) ) = 0.3233
La distribucin Binomial
b)
Solucin.
a) x = 2; n = 10 ; p = 10 % = 0.1 ; q = 0.9
dbinom( 2 , 10, 0.1) = 0.1937
b) = n p = 10 (0.1) = 1; x = 2
dpois ( 2 , 1) = 0.1839
138
(0)
4
7
5
+ (1) + (2 ) = 1.06
16
16
16
Los nmeros 4/16, 7/16, y 5/16 son las fracciones de los lanzamientos totales que tienen
como resultado cero, una y dos caras, respectivamente. Estas fracciones tambin son la
frecuencia relativa de los diferentes valores de X en nuestro experimento. En efecto,
entonces, podemos calcular la media o promedio de un conjunto de datos mediante el
conocimiento de los distintos valores que ocurren y sus frecuencias relativas, sin un
conocimiento del nmero total de observaciones en nuestro conjunto de datos.
Por tanto, si 4/16 o 1/4
lanzamientos tienen como resultado una cara y 5/16 de estos tiene dos caras, el numero
medio de caras por lanzamiento ser 1.06 sin importar si el nmero total de lanzamiento fue
16,000 o incluso 10,000.
Utilicemos frecuencias relativas para calcular el nmero promedio de caras por lanzamiento
que podramos esperar en el largo plazo. Nos referimos a este valor promedio como la
media de la variable x o la media de la distribucin de probabilidad de X y la denotamos
139
por
x o simplemente como
comn entre los estadsticos referirse a esta media como la esperanza matemtica o el valor
esperado de la variable aleatoria X y denotarla como E(X).
Supongamos que se lanza monedas legales, encontramos un espacio muestral para nuestro
experimento es
S = {HH , HT , TH , TT }.
Como los 4 puntos mustrales son iguales probables, se sigue que
1 1 1
P ( X = 0 ) = P (TT ) = =
2 2 4
P ( X = 1) = P (HT ) + P (TH ) =
P ( X = 2 ) = P (TT ) =
1 1 1
+ =
4 4 2
1
4
Este resultado significa que una persona que lance dos monedas una y otra vez, en
promedio, obtendr una cara por lanzamiento.
Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es
= E ( X ) = xf ( x) ; si X es discreta,
x
Problema: Un inspector de calidad muestrea un lote que contiene siete componentes; el lote
contiene cuatro componentes buenos y tres defectuosos. El inspector toma una muestra de
tres componentes. Encuentre el valor esperado del nmero de componentes buenos en esta
muestra.
Solucin: sea X el nmero de componentes buenos en la muestra. La distribucin de
probabilidad de x es
F ( x) =
( )( )
()
4
x
3
3 x
7
3
x = 0, 1, 2, 3
140
1
12
18
4 12
+ (1) + (2) + (3) = = 1.71
35
35
35
35 7
= E( X ) = (0)
De esta forma si se selecciona al azar una muestra de tamao tres una y otra vez de un
lote de cuatro componentes buenos y tres defectuosos, contendra, en promedio 1.7
componentes buenos.
Problema: En un juego de azar se pagaran $5 a una persona si solo salen caras(H) o
cruces (T) cuando se lanzan tres monedas, y ella pagara $ 3 si salen una o dos caras.
cual es su ganancia esperada?
Solucin: el espacio muestral para los posibles resultados cuando se lanzan de manera
simultnea tres monedas, o de manera equivalente si se lanzan tres veces una moneda, es
S = {HHH , HHT , HTH , THH , HTT , THT , TTH , TTT
Se podra argumentar que cada una de estas posibilidades es igualmente probable y que
ocurre con la probabilidad de 1/8. un mtodo alternativo seria aplicar la regla de la
multiplicacin de probabilidad para eventos independientes a cada elemento de S. Por
ejemplo,
P ( HHT) = P(H) P(H) P(T) = (1/2)(1/2)(1/2) = 1/8
La variable aleatoria de inters es Y, el monto que el jugador puede ganar; y los valores
posibles de Y son $5 si ocurre el evento
E1 = {HHH , TTT }
Y - $ 3 si ocurre el evento
141
3
4
1
4
= E (Y ) = (5) + ( 3) = 1
En este juego la persona perder, en promedio, $1 por lanzamiento de las tres monedas. Un
juego se considera equitativo si el jugador, en promedio, queda empatado. Por tanto, una
ganancia esperada de cero define un juego equitativo.
Consideremos una nueva variable aleatoria g(X), que depende de X; es decir, cada valor de
g(X) esta determinado al conocer los valores de X. Por ejemplo, g(X) podra ser X2 o 3X 1 ,
de modo que siempre que x tome el valor 2, g(X) toma el valor g(2). En particular, si X es
una variable aleatoria discreta con distribucin de probabilidad
f (x ),
x = 1,0,1,2 y g ( X ) = X 2 entonces
P[g ( X ) = 0] = P( X = 0 ) = f (0 )
P[g ( X ) = 1] = P( X = 1) + P( X = 1)
= f ( 1) + f (1),
P [ g ( X ) = 4 ] = P ( X = 2 ) = f ( 2)
g (x )
P[g ( X ) = g ( x)]
f ( 0)
f ( 1) + f (1)
f ( 2)
g ( X ) = E [g ( x ) ]
= 0 f (0 ) + 1[ f ( 1) + f (1)] + 4 f (2 )
= ( 1) f ( 1) + (0 ) f (0 ) + (1) f (1) + (2 ) f (2 )
2
= g ( x) f ( x)
x
142
g ( X ) = E[g ( X )] = g ( x) f ( x);
si X es discreta
Problema: Suponga que el numero de autos x que pasa por un lavado de autos entre 4:00
pm y 5:00 pm en cualquier viernes soleado tienen la siguiente distribucin de probabilidad :
P(X = x)
1 / 12
1 / 12
1/4
1/4
1/6
1/6
= (2x 1) f ( X)
x=4
1 1
1
1
1
1
= (7) +(9) +(11) +(13) +(15) +(17) =$12.67
12
4
4
6
12
6
Debemos extender ahora nuestro concepto de esperanza matemtica al caso de dos
variables aleatorias X y Y con distribucin de probabilidad conjunta f ( x, y ) .
Definicin
Sean X y Y variables aleatorias con distribucin de probabilidad conjunta f(x , y ). La media
o valor esperado de la variable aleatoria g(X, Y ) es
g ( X ,Y ) = E [g ( X , Y )] = g ( x, y ) f ( x, y ) ;
x
si X y Y son discretas
143
f ( x, y )
Totales por
rengln
3/28
9/28
3/28
15/28
3/14
3/14
1/28
Totales por
3/7
1/28
5/14
15/28
3/28
columna
E ( XY ) = xyf ( x, y )
x =0 y =0
E ( XY ) = (0)(0 ) f (0,0) + (0 )(1) f (0,1) + (0 )(2 ) f (0,2) + (1)(0) f (1,0) + (1)(1) f (1,1) + (2)(0) f (2,0)
3
E ( XY ) = f (1,1) =
14
Definicin
Sea X una variable aleatoria con distribucin de probabilidad f(x). La media o valor
esperado de X es
= E ( X ) = xf ( x)dx ;
si X es continua
144
20,000
x3
f ( x) =
0
x > 100
en cualquier otro caso
20000
20000
dx = 100 2 dx = 200
3
x
x
= E( X ) = x
100
Teorema
Sea x una variable aleatoria con distribucin de probabilidad f(x). La media o valor esperado
de la variable aleatoria g(X) es
g ( X ) = E[g ( X )] = g ( x) f ( x)dx ;
si X es continua
x2 1 < x < 2
,
f ( x) = 3
0
en cualquier otro caso
E (4 X + 3 ) =
(4 x + 3 )x 2 dx = 1
3
(4 x
3
2
+ 3 x 2 dx = 8
g ( X ,Y ) = E[g( X , Y )] =
g( x, y) f ( x, y)dxdy
; si X y Y son continuas.
145
UNIDA
AD III / FUN
NCIONES Y DISTRIBUCIONE
ES MUEST
TRALES.
Y
para la funcin dee densidad
X
Problema: Encuentre E
x 1 + 3y 2
f ( x, y ) =
4
0
0 < x < 2,
0 < y <1
en cualquier otro
o caso
Solucin:
Tenemos
2
3
1 y+ y
5
Y 1 2 y x(1 + 3 y )
dy =
E =
dxdy =
0
0
0
4
2
8
X
x
3.6 Distribucin no
ormal.
stribucin de la prob
babilidad contina.
3.6.1 Dis
La distribuccin continua
a de probab
bilidad ms im
mportante en
n todo el campo de la estadstica
e
es la distriibucin norm
mal. Su gra
afica, que se denomina curva
c
normal, es la curva en forma
de campan
na, la cual de
escribe much
hos fenmen
nos que ocurrren en la natturaleza, la industria y
la investiga
acin.
146
N ( , ) .
Distribucin normal
La funcin de densidad de la variable aleatoria normal X, con media
n( x; , ) =
1
( 1 )[( x ) / ]2
e 2
2
y varianza 2 , es
< x <
donde
= 3.14159...
e = 2.71828...
Z=
Caractersticas:
a)
-< x <
f ( x , , 2 ) =
2
2
1
( x ) / 2
2
-< x <
distribucin en
cuestin, la que tiene forma de campana, por lo que tambin se le conoce como
campana de Gauss. Hay un nmero infinito de funciones de densidad Normal, una
para cada combinacin de y . La media mide la ubicacin de la distribucin y la
desviacin estndar mide su dispersin.
c) Es simtrica con respecto a su eje vertical.
d) Es asinttica con respecto a su eje horizontal; esto quiere decir que jams va a tocar
el eje de las equis.
e) El rea total bajo la curva es 1.
f)
S sumamos a
147
rpida de demostrar si los datos que se analizan tienen una distribucin Normal; ya
que para trabajar los datos con esta distribucin, debe verificarse que efectivamente
as se distribuyen, ya que de no hacerlo, las decisiones que en un momento dado se
tomarn de un anlisis de los datos con la distribucin Normal, seran errneas.
Definicin
La distribucin de una variable aleatoria normal con media cero y varianza 1 se llama
distribucin normal estndar.
P ( z 1.23) = 0.8907
Para calcularlo a travs de la frmula original se le suma 0.5 que es de la parte de la regin
negativa mas lo que se va a calcular.
1.23
1
2
du = 0.8907
0.5 +
e
2 0
b) p ( Z 1, 24 )
148
UNIDA
AD III / FUN
NCIONES Y DISTRIBUCIONE
ES MUEST
TRALES.
P(Z
Z 1.24) = 1 P(Z < 1.224) = 1 0.8925
8
= 0.10075
Dos formass de calcularr:
1) usando el
e teorema P + q = 1
1.244
1
2
1 0.5 +
e
d u = 0.1075
2 0
2) Restand
do 0.5 que ess la parte com
mpleta de la regin somb
breada de la seccin possitiva
1.24
1
2
0.5
e
d u = 0.1075
0
2 0
c) P ( z - 0.72 )
P( z 0.72) = 0.23558
0
1
2
0.5
e
d u = 0 .2358
2
2 0.72
d)
p (0,5 Z 1,76)
do la figura se
e deduce que
Observand
149
1.76
u
0.5
1
2
du
du = 0.2693
e
2 0
Problema: El peso de los individuos de una poblacin se distribuye normalmente con media
de 70 Kg. y desviacin tpica 6 Kg. De una poblacin de 2000 personas, calcula cuntas
tendrn un peso comprendido entre 64 y 76 Kg.
Solucin:
Se trata de una distribucin N (70,6)
Z=
Z=
64 70
= 1
6
Z = -1
= 70 Kg. , = 6 Kg. ;
Z=
X = 64 y 76 Kg.
76 70
=1
6
Z= 1
p (64 X 769 = p ( 1 z 1)
= p (z 1) p ( z 1)
Por tanto,
p(64 X 76 ) = 0.8413 0.1587 = 0.6826
Esto significa que el 68,25 % de las personas pesan entre 64 y 76 Kg.
Como hay 2000 personas, calculamos el 68,25% de 2000 y obtenemos 1365 personas.
Problema: El acero que se utiliza para tuberas de agua a menudo se recubre internamente
con un mortero de cemento para evitar la corrosin. En un estudio de los recubrimientos de
mortero de una tubera empleada en un proyecto de transmisin de agua en California
(Transportation Engineering Journal, Noviembre de 1979) se especific un espesor de 7/16
pulgadas para el mortero. Un gran nmero de mediciones de espesor dieron una media de
0.635 pulgadas y
espesor, tenan una distribucin Normal, qu porcentaje aproximado fue inferior a 7/16 de
pulgada?
150
Solucin:
x = variable que nos define el espesor del mortero en pulgadas; = 0.635 pulgadas; =
0.082 pulgadas
Z =
7 / 16 0 . 635
0 . 4375 0 . 635
=
= 2 . 4085 2 . 41
0 . 082
0 . 082
P ( Z 2.41) = 0.0080
Por tanto, 0.008 x 100% = 0.8% de los recubrimientos de mortero tienen un espesor menor
de 7/16 pulgadas
Problema: Un tubo fluorescente estndar tiene una duracin distribuida Normalmente, con
una media de 7,000 horas y una desviacin estndar de 1,000 horas. Un competidor ha
inventado un sistema de iluminacin fluorescente compacto que se puede insertar en los
receptculos de lmparas incandescentes. El competidor asegura que el nuevo tubo
compacto tiene una duracin distribuida Normalmente con una media de 7,500 horas y una
desviacin estndar de 1,200 horas.
a)
Cul tubo fluorescente tiene mayor probabilidad de tener una duracin mayor de
9,000 horas?
b) Cul tubo tiene mayor probabilidad de tener una duracin de menos de 5,000
horas?
Solucin:
a) Tubo 1
X1 = variable que nos define la duracin en horas de un tubo fluorescente
= 7,000 horas; = 1,000 horas
Tubo 2
X2 = variable que nos define la duracin del tubo fluorescente del competidor
= 7,500 horas; = 1,200 horas
z1 =
9 ,000 7 ,000
= 2.00
1,000
151
z2 =
9 ,000 7 ,500
= 1.25
1,200
z1 =
5 ,000 7 ,000
= 2.00
1,000
z2 =
5 ,000 7 ,500
= 2.08
1,200
152
z=
90 200
= 2.20
50
menor de 90
interruptores.
b)
z1 =
225 200
= 0.50
50
z2 =
275 200
= 1.50
50
En este caso se trata de determinar que valor toma x cuando se pretende cumplir con
Z=
x = + z
Por tanto si interpolamos, encontramos que el valor de z para una probabilidad de 0.44 es
de 1.55, y es el valor que se sustituye en la ecuacin.
153
Cul es la razn de usar un rea de 0.44 en lugar de una de 0.94 para buscar en la tabla el
valor de z?
Es muy simple, la tabla que estamos usando es una tabla que solo trabaja con reas que
son definidas de la media hasta el valor de x y x puede estar tanto del lado derecho de la
media, como del lado izquierdo de la media, es por esto que el rea a utilizar es de 0.44 que
se encuentra al lado derecho de la media.
Problema: La nota media de las pruebas de acceso correspondientes a los estudiantes que
queran ingresar en una facultad era 5,8 y la desviacin tpica 1,75. Fueron admitidos los de
nota superior a 6.
a)
b)
distribucin binomial?
Solucin:
a) = 5.8 ; = 1.75 ; x = 6
Z = ( 6 5.8 ) / 1.75 = 0.11
P ( X > 6 ) = p ( Z > 0.11 ) = 1 P ( Z < 0.11 ) = 1 0.5438 = 0.4562 = 45.62 %
b) Es una distribucin Binomial de parmetros n = 10 y p = 0,4562
p(obtener r xitos ) = p (X = r) =
n
r
= p .(1 p)
nr
10
(0,4562) 4 (1 0,4562) 6 =
4
= p ( X = 4) =
10.9.8.7
(0,4562 ) 4 (0,5438) 6 = 0,235
4 .3 .2 .1
Z 2 = ( 62 50 ) / 10 = 1.2
154
p ( 45 < X < 62 ) = p ( -0.5 < Z < 1.2 ) = P ( Z < 1.2 ) P ( Z < - 0.5 )
= 0.8849 0.3085 = 0.5764
Problema: Dada una distribucin normal con = 300 y = 50, encuentre la probabilidad de
que X tome un valor mayor que 362.
Z = ( 362 300 ) / 50 = 1.24
P ( X > 362 ) = P ( Z > 1.24 ) = 1 p ( Z < 1.24 ) = 1 0.8925 = 0.1075
Problema: Una empresa elctrica fabrica focos que tienen una duracin , antes de fundirse,
que se distribuye normalmente con media igual a 800 horas y una desviacin estndar de 40
horas. Encuentre la probabilidad de que un foco se funda entre 778 y 834 horas.
Solucin:
Z 1 = ( 778 800 ) / 40 = - 0.55 ;
P (778 < X < 834 ) = p ( - 0.55 < Z < 0.85 ) = P ( Z < 0.85 ) P ( -0.55)
= 0.8023 0.2912 = 0.5111
Problema: En un proceso industrial el dimetro de un cojinete es una parte importante del
componente. El comprador establece que las especificaciones en el dimetro sean 3.0
0.01 cm. La implicacin es que ninguna parte que caiga fuera de estas especificaciones se
aceptar. Se sabe que en el proceso el dimetro de un cojinete tiene una distribucin normal
con media 3.0 y una desviacin estndar de 0.005. En promedio, cuntos cojinetes se
descartaran?
Solucin:
X 1 = 3.0 0.01 cm = 2.99 cm;
= 3.0 ; = 0.005
155
N (np, npq )
Esto permite sustituir el estudio de una B ( n , p ) por el de una
N (np, npq ) .
1
1
p( X = r ) = p r X r +
2
2
156
1
1
p(a X b) = p a X b +
2
2
1
2
= np = 400. = 200 ;
1 1
2 2
10
10
p ( Z 1,05 ) = 0,8531
Problema: Un tirador acierta en el blanco en el 70% de los tiros. Si el tirador participa en una
competicin y tira 25 veces, cul es la probabilidad de que acierte ms de 10 tiros?
Solucin:
Es una distribucin B(25; 0,7) que podemos aproximar a travs de la normal:
157
p z
= p ( z 3.06) = 1 p ( z 3.06) = 1 0.0010 = 0.999
2.29
La distribucin binomial,
(b)
Solucin
a)
numero de caras
0,3
0,25
0,2
0,15
0,1
0,05
0
0
10
15
Figura 1:
158
numerodecaras
0,3
0,25
0,2
0,15
0,1
0,05
0
0
10
12
Figura 2:
b) La distribucin de probabilidad para el numero de caras en 10 lanzamientos de la
moneda se presentan grficamente en las figuras 1 y 2 . en la figura 2 trata los datos como si
fueran continuos. La probabilidad pedida es la suma de las reas de los rectngulos
sombreados en la figura 2 y puede aproximarse por el rea bajo la correspondiente curva
normal, mostrada a trazos. Considerando los datos como continuos, se deduce que 3 a 6
caras pueden considerarse como 2.5 a 6.5 caras. Tambin la media y la varianza para la
distribucin Binomial estn dadas por:
= np = 10(0.5) = 5
= npq = 10(0.5)(0.5) = 1.58
z1 =
2.5 5
= 1.58
1.58
z1 =
6.5 5
= 0.95
1.58
159
= np = 100(0.4) = 40
= npq = 100(0.4)(0.4) = 4.899
29.5 40
= 2.14
4.899
p ( x < 30) = p ( z < 2.14) = 0.0162
z1 =
Problema: Una prueba de opcin mltiple tiene 200 preguntas cada una con cuatro
respuestas posibles de las que solo una es la correcta. Cual es la probabilidad De que con
puras conjeturas se obtengan de 25 a 30 respuestas correctas para 80 de los 200 problemas
acerca de los que el estudiante no tiene conocimiento?
Solucin : La probabilidad de un respuesta correcta para cada una de las 80 preguntas es p
= . Si X representa el nmero de respuesta correcta debidas a conjeturas entonces:
p (25 x 30) =
x = 30
b x,80, 4
x = 25
= np = 80 = 20
4
1 3
= 180 = 3.873
4 4
necesitamos el rea entre X 1 = 24.5 y X 2 = 30.5. Los valores Z correspondientes son
Z1 = (24.5 20 ) / 3.875 = 1.16
160
Sean X 1 , X 2 ,..., X n variables aleatorias independientes que son todas normales con
desviacin estndar. Entonces la variable aleatoria t =
x
tiene una distribucin t con v =
s
n
n 1 grados de libertad.
Problema: El valor t con v = 14 grados de libertad que deja un rea de 0.025 a la izquierda y
por tanto un rea de 0.975 a la derecha es
161
t0.05 y t0.05 , queda satisfecho con su afirmacin. Qu conclusin extraera de una muestra
que tiene una media de 518 gramos por milmetro y una desviacin estndar de 40 gramos?
Suponga que la distribucin de rendimiento es aproximadamente normal.
Solucin:
t=
518 500
= 2.25
40
25
Este es un valor por arriba de 1.711. Si se desea obtener la probabilidad de obtener un valor
de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es
aproximadamente de 0.02. De aqu es probable que el fabricante concluya que el proceso
produce un mejor producto del que piensa.
162
s=
(x x )
i
n 1
= 0.5347
= 0.05
con 9 grados de
Se puede observar en la grfica anterior que el valor . Corre en forma normal, esto es de
izquierda a derecha.
163
Se observa que la varianza corre en sentido contrario, pero esto es solo en la grafica. Con un
nivel de confianza del 95% se sabe que la varianza de la poblacin de los pesos de los
paquetes de semillas de pasto est entre 0.135 y 0.935 decagramos al cuadrado.
Problemas propuestos
P1. En una cierta rea de la ciudad se da como una razn del 75% de los robos la necesidad
de dinero para comprar estupefacientes. Encuentre la probabilidad que dentro de los 5
prximos asaltos reportados en esa rea
a) exactamente 2 se debieran a la necesidad de dinero para comprar drogas;
b) cuando mucho 3 se debieran a la misma razn arriba indicada.
P2. Un agricultor que siembra fruta afirma que 2/3 de su cosecha de duraznos han sido
contaminada por la mosca del mediterrneo.
inspeccionar 4 duraznos
a)
b)
P3. De acuerdo con una investigacin llevada a cabo por la Administrative Management
Society, 1/3 de las compaas en Estados Unidos le dan a sus empleados cuatro semanas
de vacaciones despus de 15 aos de servicio. Encuentre la probabilidad de que 6 de las
compaas investigadas al azar, el nmero que les dan a sus empleados cuatro semanas de
vacaciones despus de 15 aos de servicio es
a) cualquier cantidad entre 2 y 5;
b) menos de 3.
164
b)
P5. Al probar una cierta clase de neumtico para camin en un terreno escabroso se
encontr que 25% de los camiones terminaban la prueba con los neumticos daados. De
los siguientes 15 camiones probados encuentre la probabilidad de que
a)
De 3 a 6 tengan ponchaduras;
b)
c)
P6. De acuerdo con un reporte publicado en la revista Parade, septiembre 14 de 1980, una
investigacin a nivel nacional llevada a cabo por la Universidad de Michigan revel que casi
el 70% de los estudiantes del ltimo ao desaprueban las medidas para controlar el hbito
de fumar mariguana todos los das. Si 12 de estos estudiantes se seleccionan al azar y se
les pregunta su opinin, encuentre la probabilidad de que el nmero que desaprueba dicha
medida sea
a.
b.
cuando mucho 5;
c.
no menos de 8
165
de que ms de la mitad de los siguientes 20 telfonos que se instalen en esta ciudad sean
de color blanco?
P10. Se sabe que el 40% de los ratones inyectados con un suero quedan protegidos contra
una cierta enfermedad. Si 5 ratones son inyectados, encuentre la probabilidad de que
a.
b.
Menos de 2 la contraigan;
c.
Ms de 3 la contraigan
P11. Suponga que los motores de un aeroplano operan en forma independiente y de que
fallan con una probabilidad de 0.4. Suponiendo que uno de estos artefactos realiza un vuelo
seguro en tanto se mantenga funcionando cuando menos la mitad de sus
motores,
166
P16. La probabilidad de que una persona que vive en cierta ciudad posea un perro se estima
en 0.3. Encuentre la probabilidad de que la dcima persona entrevistada aleatoriamente en
esta ciudad sea la quinta persona que posee un perro.
P17. Un cientfico inocula varios ratones, uno a la vez, con un germen de una enfermedad
hasta que obtiene 2 que la han contrado. Si la probabilidad de contraer la enfermedad es
1/6. cul es la probabilidad de que se requieran 8 ratones?
P18. Suponga que la probabilidad de que una persona determinada crea una historia acerca
de los atentados a una famosa actriz es de 0.8. Cul es la probabilidad de que
a)
la sexta persona que escucha tal historia sea la cuarta que la crea?
b)
P19. Tres personas lanzan una moneda y la que salga dispareja paga los cafs. Si todas las
monedas caen iguales, se lanzan nuevamente.
167
P23. La probabilidad de que una persona muera debido a cierta infeccin respiratoria es
0.002.
personas infectadas.
P24. Suponga que en promedio 1 persona de cada 1000 comete un error numrico al
preparar su declaracin de impuestos.
Se
considerar exitosa si tiene una efectividad del 99% en sus soldaduras. De otra manera, no
se considerar eficiente.
168
c) entre 37 y 49 meses.
P29.
Las piezas de pan de centeno distribuidas a las tiendas locales por una cierta
pastelera tienen una longitud de 30cm y una desviacin estndar de 2cm. Suponiendo que
las longitudes estn normalmente distribuidas, qu porcentaje de las piezas son
a)
de ms de 31.7cm de longitud?
b)
c)
P38. Una mquina despachadora de refrescos est ajustada para servir un promedio de 200
ml por vaso. Si la cantidad de refresco es normalmente distribuida con una desviacin
estndar igual a 15 ml.
a)
b)
c)
169
UNIDAD 4
ESTADISTICA
APLICADA.
Objetivo:
Conocer
los
fundamentales
de
aspectos
la
inferencia
4.1.1 Concepto.
La teora de la inferencia estadstica consiste en aquellos mtodos por los que se realizan
inferencias o generalizaciones acerca de una poblacin. La tendencia actual es la
distribucin entre el mtodo clsico de estimacin de un parmetro de la poblacin, por
medio del cual las inferencias se basan de manera estricta en informacin que se obtiene de
una muestra aleatoria seleccionada de la poblacin, y el mtodo Bayesiano, que utiliza el
conocimiento subjetivo previo sobre la distribucin de probabilidad de los parmetros
desconocidos junto con la informacin que proporcionan los datos de la muestra. En esta
unidad utilizaremos los mtodos clsicos
4.1.2 Estimacin.
El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el
estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la
misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus
distribuciones mustrales, y mientras menor sea el error estndar de un estadstico, ms
cercanos sern unos de otros sus valores.
Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una
estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro, que
se calcula a partir de una muestra dada y sirve como una aproximacin del valor exacto
desconocido del parmetro.
El estadstico usado se denomina estimador. Una estimacin por intervalo, es la estima
de un parmetro poblacional dada por dos nmeros entre los cuales se considera que se
encuentra dicho parmetro generalmente de ancho finito
171
problemas de ingeniera, ciencia, y administracin, requieren que se tome una decisin entre
aceptar o rechazar una proposicin sobre algn parmetro. Esta proposicin recibe el
nombre de hiptesis. Este es uno de los aspectos ms tiles de la inferencia estadstica,
puesto que muchos tipos de problemas de toma de decisiones, pruebas o experimentos en
el mundo de la ingeniera, pueden formularse como problemas de prueba de hiptesis.
que
172
construyen con la funcin probabilstica del modelo estadstico adoptado para realizar la
estimacin
nivel de confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo
que incluye
producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que
el valor del parmetro que se estima est dentro del intervalo.
Intervalos (S
, S 2
, S 3
99.73
3.00
99
2.58
98
2.33
96
2.05
173
95.45
2.00
95
1.96
90
1.645
80
1.28
68.27
1.00
50
0.6745
Estos intervalos abiertos por izquierda o por derecha se denominan de una cola, mientras
que los comunes para la estimacin de parmetros poblacionales son de dos colas.
Niveles de significancia
Niveles de confianza
Coeficiente de confianza
NC = (1 ) *100
0.0005
99.95 %
3.29
0.0010
99.90 %
3.09
0.0013
99.87 %
3.00
0.0050
99.50 %
2.58
0.0100
99.00 %
2.33
0.0227
97.72 %
2.00
0.0250
97.50 %
1.96
0.0500
95.00 %
1.645
0.1587
84.13 %
1.00
99.90%
99.00%
95.00%
1 cola
3.09
2.33
1.645
2 cola
3.29
2.58
1.96
Grandes muestras ( n 30 ).
Z=
174
= x Zc
De esta frmula se puede observar que tanto el tamao de la muestra como el valor de z se
conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de
confianza establecido.
Pero en ocasiones se desconoce
= x Zc
N n
N 1
Muestras grandes.
Problema: Supngase que las estaturas de 100 estudiantes de la universidad XYZ. Hallar
los intervalos de confianza del:
a) 95 % y
b) 99 % .
Para estimar la estatura media de X = 67.45 y
universidad XYZ.
x ZC
a)
175
Zc = 1.96
67.45 + 1.96
2.93
= 68.02
67.45 1.96
100
2.93
= 66.88
100
As, pues, el intervalo de confianza del 95 % para la media poblacional es 66.88 a 68.02
pulgadas, que puede denotarse por 66.88 < < 68.02
b)
2.93
100
2.93
= 66.69
100
As, pues, el intervalo de confianza del 99 % para la media poblacional es 66.69 a 68.21
pulgadas, que puede denotarse por 66.69 < < 68.21
Problema: Las medidas de los dimetros de una muestra de 200 cojinetes de bolas hechos
por una determinada maquina durante una semana dieron una media de 0.824 pulgadas y
una desviacin tpica de 0.042 pulgadas. Hallar los limites de confianza del
a)
95 %
b)
99 %
Zc = 1.96
0.824 + 1.96
0.042
= 0.83
0.824 1.96
200
b)
0.042
= 0.818
200
Zc = 2.58
0.824 + 2.58
0.042
= 0.832
200
0.824 2.58
0.042
= 0.816
200
98 %
b)
90 %
176
c)
99.73 %
Zc = 2.33
0.824 + 2.33
0.042
= 0.831
0.824 2.33
200
b)
0.042
= 0.817
200
Zc = 1.645
0.824 + 1.645
0.042
= 0.829
0.824 1.645
200
c)
0.042
= 0.819
200
Zc = 3.00
0.824 + 3.00
0.042
= 0.833
0.824 3.00
200
0.042
= 0.815
200
Problema: Al medir el tiempo de reaccin, un psiclogo estima que la desviacin tpica del
mismo es de 0.05 segundos.
Cul es el numero de medidas que deber hacer para que sea del
a)
95 %
b)
99 %
Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(1.96 ) ( 0.05 ) / n = 0.01, es decir,
n = (1.96)(0.05) / 0.01
n = 9.8
n = 96.04.
As, pues, se puede estar en la confianza del 95 % de que el error de la estima ser
menor de 0.01 si n es 96 o mayor.
177
b)
Tomando = s = 0.05 segundos, se tiene que el error ser igual a 0.01 si:
(2.58) ( 0.05 ) / n = 0.01, es decir,
n = (2.58)(0.05) / 0.01
n = 166.41.
As, pues, se puede estar en la confianza del 99 % de que el error de la estima ser menor
de 0.01 si n es 166 o mayor.
Problema: Se encuentra que la concentracin promedio de zinc que se saca del agua a
partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por
mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de
zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3.
Solucin:
Para el 95 % , Z c = 1.96
2.6 + 1.96
= 2.7
36
0.3
2.6 1.96
= 2.5
36
0.3
2 .5 < < 2 .7
para el 99 % ; Z c = 2.58
2.6 + 2.58
0.3 = 2.73
36
2.6 2.58
0.3 = 2.47
36
178
focos tiene una duracin promedio de 780 horas, encuentre un intervalo de confianza de
96% para la media de la poblacin de todos los focos que produce esta empresa.
Solucin:
= 765.03
30
780 2.05
40
= 794.97
30
780 + 2.05
40
Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce
la empresa est entre 765 y 765 horas.
Problema: La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la
calidad de una unin entre un material de reparacin y su sustrato de concreto. El artculo
Testing the Bond Between Repair Materials and Concrete Substrate informa que, en cierta
investigacin, se obtuvo una resistencia promedio muestral de 17.17 N/mm2, con una
muestra de 48 observaciones de resistencia al corte, y la desviacin estndar muestral fue
3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la
resistencia al corte.
Solucin:
Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado
como sigue:
Inferior a 95 % de la tabla es el 90 % que tiene
Z c = 1.645
3 . 28
17 .17 1 .645
= 16 .39
48
Problema: Suponga que un centro de computo regional desea evaluar el desempeo de su
sistema de memoria en disco. Una medida del desempeo es el tiempo medio entre fallas de
su unidad de disco. A fin de estimar este valor, el centro registro el tiempo entre fallas para
una muestra aleatoria de 45 fallas de la unidad de disco. Se calcularon las siguientes
estadsticas:
179
1762 1.645
215
45
= 1709.3
1762 + 1.645
215
45
= 1814.7
Cuales son los limites de confianza del 95 % para la estima de la media de las
200 calificaciones?
b)
Con que grado de confianza podr decirse que la media de las 200 calificaciones
es 75 1?
Solucin:
a)
b)
200 50
= 77.41
50 200 1
10
75 1.96
200 50
= 72.59
50 200 1
10
75 + Z
c
10
200 50
50
200 1
75 1.23 Z c
Puesto que esto debe ser igual a 75 1 , se tiene que 1.23 Z
=1Z
= 0.81. El rea
180
pero refuerza el hecho de que mientras menor sea el error estndar de la media, menor es el
tamao de muestra necesario para lograr un cierto grado de precisin.
Se estableci antes que una forma de disminuir el error de estimacin es aumentar el
tamao de la muestra, si ste incluye el total de la poblacin, entonces
x sera igual
a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible
determinar un tamao de la muestra tal que el error de estimacin sea tan pequeo como
queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimacin
se puede escoger un tamao de muestra n tal que
Z
n
Z
n=
Como n debe de ser un nmero entero, redondeamos hacia arriba todos los resultados
fraccionarios.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:
Z N n
n N 1
n=
Z 2 2 N
2 ( N 1) + Z 2 2
Problema: Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado
de Maryland. Un estudio anterior de diez ciervos cazados mostr que la desviacin estndar
de sus pesos es de 12.2 libras. Qu tan grande debe ser una muestra para que el bilogo
tenga el 95% de confianza de que el error de estimacin es a lo ms de 4 libras?
Solucin:
181
Z
(1 . 96 )(12 . 2 )
n =
=
= 35 . 736
4
( 2 . 053 ) (40 )
Z
n=
=
= 67 . 45
10
Se necesita una muestra de 68 focos para estimar la media de la poblacin y tener un error
mximo de 10 horas. Qu pasara si en lugar de tener un error de estimacin de 10 horas
slo se requiere un error de 5 horas?
( 2 . 053 ) (40 )
Z
n=
=
= 269 . 74
Se puede observar como el tamao de la muestra aumenta, pero esto tiene como beneficio
una estimacin ms exacta.
Problema: Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se
desea saber de que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
Solucin:
( 2.053) ( 40 ) ( 300 )
z 2 2 N
n= 2
=
= 55.21
2
2
2 2
( N 1) + z
(10 ) ( 300 1) + ( 2.0532 ) ( 40 )
2
182
Si se tiene una poblacin finita de 300 focos slo se tiene que extraer de la poblacin una
muestra sin reemplazo de 55 focos para poder estimar la duracin media de los focos
restantes con un error mximo de 10 horas.
1 y 2
1 y 2
varianzas
12 y 22 , respectivamente, un
1 - 2 se
x1 x2 . Por
Z =
( x1 x 2 ) ( 1 2 )
12
n1
1 - 2
2
2
n2
se tiene:
1 2 = ( x1 x 2 ) Z
12
n1
22
n2
183
Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la
media mayor menos la media menor. En este caso ser la media del motor B menos la
media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.
1 2 = ( x1 x 2 ) Z
12
n1
22
n2
36 64
+
50 75
n1
n2
12
12
184
=Z
12
n1
22
n2
n=
Z 2 ( 12 + 22 )
Para el segundo caso se pondr una n en funcin de la otra. Este caso se utiliza cuando las
poblaciones son de diferente tamao y se sabe que una es K veces mayor que la otra.
Problema: Un director de personal quiere comparar la efectividad de dos mtodos de
entrenamiento para trabajadores industriales a fin de efectuar cierta operacin de montaje.
Se divide un nmero de operarios en dos grupos iguales: el primero recibe el mtodo de
entrenamiento 1, y el segundo, el mtodo 2. Cada uno realizar la operacin de montaje y se
registrar el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan
una desviacin estndar aproximadamente de 2 minutos. Si se desea que la estimacin de
la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una
probabilidad igual a 0.95,
Cuntos trabajadores se tienen que incluir en cada grupo de entrenamiento?
Solucin:
n=
Z 2 ( 12 + 22 )
(1.969) 2 (22 + 22 )
= 31
12
185
Z=
pP
Pq
n
P = p Zc
Pq
n
P = p Zc
Pq
n
P = p Zc
Pq
n
Pq
n
186
n = 500;
p = 15 / 500 = 0.03;
z = 1.645
pq
n
0.0175 < P < 0.0425
P = pz
Problema: En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se
encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa muestra se usa
para estimar P, que vendr a ser la proporcin verdadera de todas las pilas defectuosas tipo
B fabricadas por la Everlast Company, encuentre el mximo error de estimacin e tal que se
pueda tener un 95% de confianza en que P dista menos de
de p.
Solucin:
P = x / n = 20 / 400 = 0.05
Z c = 1.96
=Z
(0.05)(0.95)
pq
= 1.96
= 0.021
400
n
Si p = 0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista
menos de 0.021 de p. En otras palabras, si p = 0.05 se usa para estimar P, el error mximo
de estimacin ser aproximadamente 0.021 con un nivel de confianza del 95%. Para calcular
el intervalo de confianza se tendra: P = 0.05 0.021
Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se
sabe que la proporcin de pulas defectuosas de esta compaa est entre 0.029 y 0.071. Si
se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el
tamao de la muestra.
187
; Zc = 1.645
P = 0.20 1.645
(0.20)(0.8)
300
(0.4)(0.6)
pq
= 0.4 (1.96)
= 0.4 0.056
295
n
0.344 < P < 0.456
P = pZ
Problemas propuestos:
P1. Una encuesta sobre vivienda estadounidense realizada por el Departamento de
Comercio de Estados Unidos revelo que 750 de 1500 propietarios de casa muestreados
siguen la filosofa de hgalo usted mismo , es decir, realizaron ellos mismos la mayor parte
del trabajo en por lo menos una de las mejoras o reparaciones de su hogar ( Bureau of the
Census, Statistical Brief, mayo de 1992). Estime, con un intervalo de confianza de 95 %, la
verdadera proporcin de propietarios de casas estadounidenses que realizan ellos mismos
la mayor parte del trabajo de mejoramiento o reparacin de sus hogares.
188
P2. La encuesta del Agujero Negro, patrocinada por el Consejo de Investigacin sobre
Empleo Profesional, informa cuales son los puestos mas difciles de llenar en las listas de los
reclutadores. En la encuesta mas recientes, 95 de 285 reclutadores consideraron los
puestos de ingeniera como los mas difciles de llenar. ( Industrial Engineering, agosto de
1990). Estime el verdadero porcentaje de reclutadores que consideran que los puestos mas
difciles de llenar son los de ingeniera. Utilice un intervalo de confianza de 99 % .
P3. Como parte de un convenio de cooperacin en investigacin entre Estados Unidos y
Japn, se diseo un edificio de concreto armado a escala completa y se aprob en
condiciones simuladas de carga de un terremoto en Japn (Journal of Structural
Enginnering, enero de 1986). En una parte del estudio se pidi a varios ingenieros de diseo
estadounidense que evaluaron el nuevo diseo. De los 48 ingenieros encuestados, 36
opinaron que la pared de cizallamiento de la estructura tena un refuerzo demasiado ligero.
Establezca un intervalo de confianza de 95 % para la verdadera proporcin de ingenieros de
diseo estadounidenses que consideran que la pared de cizallamiento del edificio tiene un
refuerzo demasiado ligero.
Z =
Despejando
( p 1 p 2 ) ( P1 P 2 )
P1 q 1
P2 q 2
+
n1
n2
P1 P2 de esta ecuacin:
P1 P2 = ( p 1 p 2 ) Z
P1 q 1
P q
+ 2 2
n1
n2
Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el
despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos
estimar, por lo que se utilizarn las proporciones de la muestra como estimadores puntuales:
P1 P 2 = ( p 1 p 2 ) Z
P1 q 1
P q
+ 2 2
n1
n2
189
P1 P 2 = ( p 1 p 2 ) Z
P1 q 1
P q
+ 2 2
n1
n2
No usuario
Tamao muestral
1246
11178
Numero de disfunciones
42
294
Proporcin muestral
0.0337
0.0263
P1 P2 = ( p1 p 2 ) Z
P1 q1 P2 q 2
+
n1
n2
190
vehculos elegidos al azar que transitaron por la calle y observo 49 violaciones del lmite de
velocidad. Despus de que el limite se elevo a 35 millas por hora, el ingeniero volvi a vigilar
las velocidades de 100 vehculos elegidos aleatoriamente y observo 19 que violaron el
limite. Establezca un intervalo de confianza de 99% para
( p1 p2 ) , donde p1 es la
P1 P2 = ( p1 p 2 ) Z
P1 P2 = (0.49 0.19) 2.58
P1 q1 P2 q 2
+
n1
n2
(0.49)(0.51) (0.19)(0.81)
+
= 0.30 0.164
100
100
pq
n
191
n =
pq
2
Esta frmula est algo engaosa, pues debemos utilizar p para determinar el tamao de la
muestra, pero p se calcula a partir de la muestra.
Existen ocasiones en las cuales se tiene una idea del comportamiento de la proporcin de la
poblacin y ese valor se puede sustituir en la frmula, pero si no se sabe nada referente a
esa proporcin entonces se tienen dos opciones:
Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimacin
de P. Despus con el uso de la frmula se podra determinar de forma aproximada
cuntas observaciones se necesitan para proporcionar el grado de precisin que se
desea.
En el caso de que se tenga una poblacin finita y un muestreo sin reemplazo, el error de
estimacin se convierte en:
=Z
pq
n
N n
N 1
n=
Z 2 pqN
2 ( N 1) + Z 2 pq
Problema: En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de
Hamilton, Canad, se encuentra que 340 estn suscritas a HBO. Qu tan grande se
requiere que sea una muestra si se quiere tener 95% de confianza de que la estimacin de P
est dentro de 0.02?
Solucin:
p = 340/500=0.68.
n=
Z 2 pq
(1.96) 2 (0.68)(0.32)
= 2089.83
(0.02) 2
192
Por lo tanto si basamos nuestra estimacin de P sobre una muestra aleatoria de tamao
2090, se puede tener una confianza de 95% de que nuestra proporcin muestral no diferir
de la proporcin real por ms de 0.02.
Problema: Una legisladora estatal desea encuestar a los residentes de su distrito para
conocer qu proporcin del electorado conoce la opinin de ella, respecto al uso de fondos
estatales para pagar abortos. Qu tamao de muestra se necesita si se requiere un
confianza del 95% y un error mximo de estimacin de 0.10?
Solucin:
En este problema, se desconoce totalmente la proporcin de residentes que conoce la
opinin de la legisladora, por lo que se utilizar un valor de 0.5 para p.
n=
Z 2 pq
(1.96) 2 (0.50)(0.50)
= 96.04
(0.10) 2
Se requiere un tamao de muestra de 97 residentes para que con una confianza del 95% la
estimacin tenga un error mximo de 0.10.
=Z
p1q1 p2 q2
+
n1
n2
n=
z 2 ( p1 q1 + p 2 q 2 )
193
P2. Si la empresa de productos alimenticios quiere estimar la diferencia dentro de 0.04, con
una probabilidad de 0.95, Cuntos consumidores habr que muestrear en cada mercado?
Solucin:
n=
Z 2 ( p1q1 + p 2 q 2 )
Se tendr que realizar encuestas a 1201 consumidores de cada mercado para tener una
estimacin con una confianza del 95% y un error mximo de 0.04.
Problemas propuestos
P1. Se prob una muestra aleatoria de 400 cinescopios de televisor y se encontraron 40
defectuosos. Estime el intervalo que contiene, con un coeficiente de confianza de 0.90, a la
verdadera fraccin de elementos defectuosos.
P2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo,
exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de
montaje. Si la experiencia previa sugiere que
montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos
operarios habr que incluir en la muestra?
P3. El decano registr debidamente el porcentaje de calificaciones D y F otorgadas a los
estudiantes por dos profesores universitarios de matemticas. El profesor I alcanz un 32%,
contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la
diferencia entre los porcentajes de calificaciones D y F otorgadas por los dos profesores.
Utilice un nivel de confianza del 95% e interprete los resultados.
P4. Suponga que se quiere estimar la produccin media por hora, en un proceso que
produce antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados
al azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3
onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel de
confianza del 95%.
P5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos
en un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos
194
tendra que andar alrededor de 0.2. Qu tan grande tendra que seleccionar la muestra si
se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza fe
95%?
P6. Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de
produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la
diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de
confianza de 0.90 e intrprete los resultados.
P7. Se tienen que seleccionar muestras aleatorias independientes de n1 = n2 = n
observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la
diferencia entre los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad
de 0.98. qu tan grande tendra que ser n?. No se tiene informacin anterior acerca de los
valores P1 y P2, pero se quiere estar seguro de tener un nmero adecuado de
observaciones en la muestra.
P8. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de
largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la
experiencia pasada con el proceso de fabricacin se supone que las desviaciones estndar
de las resistencias a la tensin son conocidas. La desviacin estndar del larguero 1 es de
1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el comportamiento de las
resistencias a la tensin de las dos clases de largueros son aproximadamente normal. Se
toma una muestra de 10 largueros del tipo 1 obtenindose una media de 87.6 Kg/mm2, y
otra de tamao 12 para el larguero 2 obtenindose una media de 74.5 Kg/mm2. Estime un
intervalo de confianza del 90% para la diferencia en la resistencia a la tensin promedio. 50
P9. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los
sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de
los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es 1 = 2 =
3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error
en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que
4 cm/s con una confianza del 99%?.
195
Las pruebas que se realizan para plantear las hiptesis se conocen con el nombre de
ensayos de validacin estadstica. El problema bsico es determinar si las diferencias
observadas entre el valor obtenido y el valor esperado se deben al azar, o si realmente son
diferentes.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido
utilizado en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters
se centra sobre la rapidez de combustin promedio. De manera especfica, el inters recae
en decir si la rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de
manera formal como
H 0 ; = 50 cm / s
H 1 ; 50 cm / s
La proposicin Ho; = 50 cm/s, se conoce como hiptesis nula, mientras que la
proposicin H1; 50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la
hiptesis alternativa especifica valores de que pueden ser mayores o menores que 50
196
Ho; = 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del
parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres
maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso,
entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha
cambiado el valor del parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso
bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora
o modelo.
3.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el
nombre de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del
empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters. Si
esta informacin es consistente con la hiptesis, se concluye que sta es verdadera; sin
embargo si esta informacin es inconsistente con la hiptesis, se concluye que esta es falsa.
Debe hacerse hincapi en que la verdad o falsedad de una hiptesis en particular nunca
puede conocerse con certidumbre, a menos que pueda examinarse a toda la poblacin.
Usualmente esto es imposible en muchas situaciones prcticas. Por tanto, es necesario
desarrollar un procedimiento de prueba de hiptesis teniendo en cuenta la probabilidad de
llegar a una conclusin equivocada. La hiptesis nula, representada por Ho, es la
afirmacin sobre una o ms caractersticas de poblaciones que al inicio se supone cierta (es
197
H 0 ; = 50 cm / s
H 1 ; 50 cm / s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se
observa cual es la rapidez de combustin promedio muestral. La media muestral es un
estimador de la media verdadera de la poblacin. Un valor de la media muestral x que este
prximo al valor hipottico = 50 cm/s es una evidencia de que el verdadero valor de la
media m es realmente 50 cm/s; esto es, tal evidencia apoya la hiptesis nula Ho. Por otra
parte, una media muestral muy diferente de 50 cm/s constituye una evidencia que apoya la
hiptesis alternativa H1. Por tanto, en este caso, la media muestral es el estadstico de
prueba.
198
x <48.5 x > 51.5, entonces se acepta la hiptesis alternativa H1; 50 cm/s. Los
valores de x que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de
la prueba, mientras que todos los valores que estn en el intervalo 48.5 x 51.5 forman la
regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el
nombre de valores crticos. La costumbre es establecer conclusiones con respecto a la
hiptesis nula Ho. Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en
la regin crtica, de lo contrario, no se rechaza Ho.
Contrastes de hiptesis y significacin o reglas de decisiones:
Si suponemos que una hiptesis particular es cierta pero vemos que los resultados hallados
en una muestra aleatoria difieren notablemente de los esperados bajo tal hiptesis entonces
diremos que las diferencias observadas son significativas y nos veramos inclinados a
rechazar la hiptesis.
Los procedimientos que nos capacitan para determinar si las muestras observadas difieren
significativamente de los resultados esperados y por tanto nos ayuda a decidir si aceptamos
o rechazamos hiptesis, se llama contraste (o tests) de hiptesis o de significacin o reglas
de decisin.
Nivel de significacin.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos a
correr el riesgo de cometer un error tipo I se llama nivel de significacin del contraste. Esta
probabilidad se denota a menudo por , se suele especificar antes de tomar una muestra, de
manera que los resultados obtenidos no influyan a nuestra eleccin.
Es frecuente un nivel de significacin de 0.05 o 0.01, si bien se usan otros valores si por
ejemplo, se escoge el nivel de significacin 0.05 (o 5 %) al disear una regla de decisiones
entonces hay 5 oportunidades entre 100 de rechazar la hiptesis cuando debiera haberse
aceptado; es decir, tenemos un 95 % de confianza de que hemos adoptado la decisin
correcta y por lo tanto tiene una probabilidad de 0.05 de ser falsa.
199
Bilateral
Unilateral Derecho
Unilateral Izquierdo
Valores criticos z,
Valores
0.10
-1.28 o 1.28
-1.645 y 1.645
0.05
-1.645 0 1.645
-1.96 y 1.96
0.01
-2.33 o 2.33
-2.58 y 2.58
0.005
-2.58 0 2.58
-2.81 y 2.81
0.002
-2.88 o 2.88
-3.08 y 3.08
Bilateral
criticos
z,
Unilateral Derecho
200
Unilateral Izquierdo
reducir al hacer un ajuste en el valor crtico. Puede ser necesario aumentar el tamao de la
muestra para compensar la disminucin que ocurre de manera automtica en la potencia de
la prueba (probabilidad de rechazar Ho dado que una alternativa especfica es verdadera).
Por generaciones enteras de anlisis estadstico, se ha hecho costumbre elegir un nivel de
significancia de 0.05 0.01 y seleccionar la regin crtica en consecuencia. Entonces, por
supuesto, el rechazo o no rechazo estricto de Ho depender de esa regin crtica. En la
estadstica aplicada los usuarios han adoptado de forma extensa la aproximacin del valor
P. La aproximacin se disea para dar al usuario una alternativa a la simple conclusin de
rechazo o no rechazo.
La aproximacin del valor P como ayuda en la toma de decisiones es bastante natural pues
casi todos los paquetes de computadora que proporcionan el clculo de prueba de hiptesis
entregan valores de P junto con valores de la estadstica de la prueba apropiada.
201
. Por
otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha
cometido un error de tipo II, la probabilidad de cometer un error tipo II se denota por el
smbolo
Ho es verdadera
Ho es falsa
Aceptar Ho
No hay error
Error tipo II
Rechazar Ho
Error tipo I
No hay error
202
Interpretar correctamente hacia que distribucin muestral se ajustan los datos del
enunciado.
2.
Interpretar correctamente los datos del enunciado diferenciando los parmetros de los
estadsticos. As mismo se debe determinar en este punto informacin implcita como el tipo
de muestreo y si la poblacin es finita o infinita.
3.
Establecer la regla de decisin. Esta se puede establecer en funcin del valor crtico, el
funcin del estadstico lmite de la distribucin muestral. Cada una de las hiptesis deber
ser argumentada correctamente para tomar la decisin, la cual estar en funcin de la
hiptesis nula o Ho.
5.
6.
203
= 70
= 8.9
x = 71.8
n = 100
= 0.05
3. Ho : = 70 aos
H1 : > 70 aos
Z =
x 0
71 . 8 70
= 2 .02
89
100
6. Justificacin y decisin:
Como 2.02 > 1.645 se rechaza Ho y se concluye con un nivel de significancia del 0.05 que la
vida media hoy en da es mayor que 70 aos.
204
Problema: Una empresa elctrica fabrica focos que tienen una duracin que se distribuye de
forma aproximadamente normal con una media de 800 horas y una desviacin estndar de
40 horas. Si una muestra aleatoria de 30 focos tiene una duracin promedio de 788 horas,
muestran los datos suficiente evidencia para decir que la duracin media ha cambiado?
Utilice un nivel de significancia del 0.04.
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 800 horas
= 40 horas
x = 788 horas
n = 30
= 0.04
3. Ensayo de hiptesis
Ho;
= 800 horas
H1;
1 800 horas
4. Regla de Decisin:
Si 2.052 ZR 2.052 No se rechaza Ho
Si ZR < -2.052 si ZR > 2.052 Se rechaza Ho
5. Clculos:
Z=
x 0
788 800
= 1 .643
40
30
205
6.Justificacin y decisin:
2.052 -1.643 2.052 por lo tanto, no se rechaza Ho y se concluye con un nivel de
significancia del 0.04 que la duracin media de los focos no ha cambiado.
Problema: Un fabricante de equipo deportivo desarrolla un nuevo sedal sinttico que afirma
tiene una resistencia media a la tensin de ocho kilogramos con una desviacin estndar de
0.5 Kg. Pruebe la hiptesis = 8 Kg. Contra la alternativa 8 Kg. si se prueba una
muestra aleatoria de 50 sedales y se encuentra que tiene una resistencia media a la tensin
de 7.78 Kg. utilice un nivel de significancia de 0.01
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 8 Kg.
= 0.5 Kg.
x = 7.8 Kg.
n = 50
= 0.01
3. Ho : = 8 Kg.
H1 :
4.
8 Kg.
Regla de Decisin:
Si 2.58 ZR 2. 58 No se rechaza Ho
Si ZR < -2.58 si ZR > 2.58 Se rechaza Ho
5. Clculos:
Z =
x 0
n
6.
7 .8 8 .0
= 2 . 83
0 .5
50
Justificacin y decisin:
206
Como Si 2.83 < -2.58 por lo tanto, se rechaza Ho y se concluye que la resistencia
promedio a la tensin no es igual a 8 Kg. sino que, de hecho, es menor que 8 Kg. con un
nivel de significancia del 0.01 .
Problema: Una muestra aleatoria de 64 bolsas de palomitas de maz pesan, en promedio
5.23 onzas con una desviacin estndar de 0.24 onzas. Pruebe la hiptesis de que
= 5.5
onzas contra al hiptesis alternativa, < 5.5 onzas en el nivel de significancia de 0.05.
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar
desconocida, pero como el tamao de muestra es mayor a 30 se puede tomar la
desviacin muestral como un estimador puntual para la poblacional.
2. Datos:
= 5.5 onzas
= 0.24 onzas
x = 5.23 onzas
n = 64
a = 0.05
3. Ensayo de hiptesis
Ho;
= 5.5 onzas
H1;
4. Regla de decisin:
Si ZR
-1.645 No se rechaza Ho
207
Z=
x 0
5 .25 5 .5
= 9
0 .24
64
6. Justificacin y decisin:
Como 9 < -1.645 por lo tanto se rechaza Ho y se concluye con un nivel de significancia del
0.05 que las bolsas de palomitas pesan en promedio menos de 5.5 onzas.
Problema: La duracin media de una muestra de 100 tubos fluorescentes producidos por
una compaa resulta ser 1570 hrs. Con una desviacin tpica de 120 hrs. Si es la duracin
media de todos los tubos producidos por la compaa, comprobar la hiptesis = 1600 hrs.
Contra la hiptesis alternativa 1600 hrs. Con un nivel de significancia de (a) 0.05 y (b)
0.01
Solucin:
a)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.05
n = 100
x = 1570
= 120 hrs.
3. Ensayo de hipotesis
H0 : = 1600 hrs.
H1 : 1600 hrs.
4. Regla de decisin
Si 1.96 ZR 1.96 No se rechaza Ho
Si ZR < -1.96 si ZR > 1.96 Se rechaza Ho
5. Clculos
208
Z=
1570 1600
= 2.50
120
100
6. Justificacin y decisin
Como Si 2.50 < -1.96 por lo tanto, se rechaza Ho y se concluye que La duracin media
de una muestra de 100 tubos fluorescentes producidos por una compaa no resulta ser
1570 hrs., sino que, de hecho , es menor que 1570 hrs. con nivel de significancia del
0.05 que la duracin media de todos los tubos producidos por la compaa no ha
cambiado.
b)
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.01
n = 100
x = 1570
= 120 hrs.
3. Ensayo de hipotesis
H0 : = 1600 hrs.
H1 : 1600 hrs.
4. Regla de decisin
Si 2.58 ZR 2.58 No se rechaza Ho
Si ZR < -2.58 si ZR > 2.58 Se rechaza Ho
5. Clculos
Z=
1570 1600
= 2.50
120
100
6. Justificacin y decisin
Como Si 2.58 -2.50 2.58 como se encuentra dentro de este rango, se acepta Ho (o no
se toma ninguna decisin) al nivel de significacin del 0.01
209
Problema: La resistencia a la rotura de los cables producidos por un fabricante tiene una
media de 1800 libras y una desviacin tpica de 100 libras. Mediante una nueva tcnica en el
proceso de fabricacin se aspira a una resistencia pueda ser incrementada. Para ensayar
esta aspiracin, se ensaya una muestra de 50 cables y se encuentra que su resistencia
media es de 1850 libras. Puede mantenerse que, en efecto, hay un aumento de resistencia
al nivel de significacin del 0.01?
Solucin:
1. Se trata de una distribucin muestral de medias con desviacin estndar conocida.
2. Datos:
= 0.01
n = 50
x = 1850 lbs
= 100 lbs
3. Ensayo de hipotesis
H0 : = 1800 lbs
H1 : > 1800 lbs.
4. Regla de decisin
Si ZR 2..33 No se rechaza Ho
Si ZR > 2.33 Se rechaza Ho
5. Clculos
Z =
1850
1800
100
50
= 3 . 54
6. Justificacin y decisin
Como Si 3.54 > 2.33 por lo tanto, se rechaza Ho y se acepta H
1,
por lo tanto se
210
= 0.05 , y el
= 40cm / s
40com / s .
x = 41.25cm / s
x = 41.25cm / s
= 40cm / s
= 2cm / s
n = 25
= 0.05
3. Ensayo de hiptesis
H 0 : = 40cm / s
H1 : 40cm / s
4. regla de decisin
-1.96 Z 1.96 se acepta H0
Z<-1.96 Z>1.96 se acepta H1
5. clculos
Z=
x 0
41.25 40
= 3.13
2
25
6. justificacin y decisin
3.13 >1.96 se acepta H1 y se concluye que la tasa de quemado media no es igual a
40 cm/s, sino que mas de 40 cm/s.
Varianza desconocida.
Las variables aleatorias X1, X2, ... X
n( x )
tiene una
s
211
La estructura de la prueba es idntica a la del caso con conocida, con la excepcin de que
el valor en la estadstica de prueba se reemplaza por la estimacin de S calculada y la
distribucin normal estndar se reemplaza con una distribucin . Como resultado; para la
hiptesis bilateral
Ho : = o
Hi : o
El rechazo de Ho en un nivel de significancia resulta cuando una estadstica calculada.
t=
x 0
s
n
Problema: Los cientficos han citado al benceno, un disolvente qumico de uso comn en la
sntesis de plsticos, como un posible agente causante de cncer. Ciertos estudios han
demostrado que las personas que trabajan con benceno durante mas de cinco aos tienen
una incidencia de leucemia 20 veces mayor que la poblacin en general. En consecuencia,
el gobierno federal estadounidense ha bajado el nivel mximo permisible de benceno en
lugar de trabajo de 10 partes por milln (ppm) a 1 ppm ( informacin en el Florida Times
Union, 2 de abril de 1984). Suponga que una fabrica de artculos de acero, que expone a sus
trabajadores diariamente a benceno, esta siendo investigada por la Administracin de
Seguridad y Salud Ocupacional (OSHA) de Estados Unidos. Se examinan 20 muestras de
aire, tomada durante un periodo de un mes, parar determinar el contenido de benceno. Los
anlisis produjeron las siguientes estadsticas resumidas:
= 0.05
Solucin:
1. se trata de una distribucin muestral de medias con varianza desconocida.
2. datos:
212
x = 2.1 ppm
s = 1.7 ppm
n = 20
= 1 ppm
= 0.05
3. Ensayo de hiptesis
H0:
=1
H1:
>1
4. Regla de decisin :
t
5.
clculos :
t=
x 0
s
n
t=
2.1 1
x 0
=
= 2.89
s
1.7
n
20
6. justificacin y decisin.
2.89
= 150 psi
150 psi .
= 0.05 .
Si una muestra
213
x = 152.18 y s 2 = 16.63 .
x = 152.18
s 2 = 16.63
n = 15
= 150
= 0.05
3. Ensayo de hiptesis
H 0 : = 150
H1 : 150
por ser bilateral
= 0.05
0.05
= 0.025
2
4. regla de decisin
t=
x 152.18 150
= 2.07
=
s
16.63
n
15
6. justificacin y decisin
= 150 psi
214
2.
Datos:
1 = 2 = 8
x1 = 121min
x2 = 112 min
n1 = n2 = 10
= 0.05
3.
Ensayo de hiptesis
H 0 : 1 2 = 0
H1 : 1 2 > 0
4.
Regla de decisin
Z 1.645 se acepta H 0
Z > 1.645 se acepta H1
5.
Clculos
215
Z=
6.
(121 112) 0
82 82
+
10 10
= 2.52
Justificacin y decisin
Puesto que 2.52 > 1.645, se acepta H1, y se concluye con un nivel de significancia de 0.05
que la adicin del nuevo ingrediente a la pintura si disminuye de manera significativa el
tiempo promedio se secado.
Problema: Se utiliza dos mquinas para llenar botellas de plstico con un volumen neto de
16.0 onzas. Las distribuciones de los volmenes de llenado pueden suponerse normales,
con desviaciones estndar de 0.020 y 0.025 onzas. Un miembro del grupo de ingeniera de
calidad sospecha que el volumen neto de llenado de ambas mquinas es el mismo, sin
importar si este es o no de 16 onzas. De cada mquina se toma una muestra aleatoria de 10
botellas.
Se encuentra el ingeniero en lo correcto?
Utilice un nivel de significancia de 0.05.
MAQUINA 1
MAQUINA 2
16.03
16.01
16.02
16.03
16.04
15.96
15.97
16.04
16.05
15.98
15.96
16.02
16.05
16.02
16.01
16.01
16.02
15.99
15.99
16.00
Solucin:
1.
2.
Datos:
1 = 0.020; 2 = 0.025
x1 = 16.015; x2 = 16.005
n1 = n2 = 10; = 0.05
3. Ensayo de hiptesis
216
H 0 : 1 2 = 0
H1 : 1 2 0
4.
Regla de decisin
Z=
(16.015 16.005) 0
(0.020) 2 (0.025) 2
+
10
10
= 0.987
6. Justificacin y decisin
Puesto que
217
2.
Datos:
1 = 2 = 1.0 psi
x1 = 162.5 psi
x2 = 155 psi
n1 = 10
n2 = 12
= 0.05
3.
Ensayo de hiptesis
H 0 : 1 2 = 10
H1 : 1 2 > 10
4. Regla de decisin
Z 1.645 se acepta H 0
Z > 1.645 se acepta H1
5. Clculos
Z=
(162.5 155) 10
(1) 2 (1) 2
+
10 12
= 5.83
.
6. Justificacin y decisin
No existe evidencia suficiente para apoyar el uso del plstico 1 ya que
5.83 1.645 , se
acepta H0.
218
Problema: La gerente de planta de una fbrica enlatadora de jugo de naranja est interesada
en comprar el rendimiento de dos diferentes lneas de produccin. Como la lnea nmero 1
es relativamente nueva, sospecha que el nmero de cajas que se producen al da es mayor
que el correspondiente a la vieja lnea 2. se toman datos al azar durante diez das para cada
lnea, encontrndose que
12 = 40
22 = 50. con
x1 = 824.9cajas ; x2 = 818.6
12 = 40 ; 22 = 50.
n1 = n2 = 10 ; = 0.05
3. ensayo de hiptesis
H 0 : 1 = 2
H1 : 1 > 2
4. regla de decisin
Z > 1.645 se acepta H1
Z -1.645 se acepta H0
5. Clculos
Z
6.
(824.9 818.6) 0
= 2.10
40 50
+
10 10
justificacin y decisin
219
2.10 > 1.645 se acepta H1. se concluye que el numero medio de cajas producidas
diariamente por la nueva lnea de produccin es mayor que el numero medio de caja
producidas por la vieja lnea.
P = 0.70
p = 8 / 15 = 0.5333
n = 15
= 0.10
3. Ensayo de hiptesis
Ho; P = 0.70
H1; P
0.70
4. Regla de Decisin:
Si 1.645 Z 1.645 No se rechaza Ho
Si ZR < -1.645 si ZR > 1.645 Se rechaza Ho
5. Clculos:
220
Z=
0.533 0.70
pP
=
= 1.41
Pq
(0.70)(0.30)
n
15
6. Justificacin y decisin :
Como 1.645 -1.41 1.645 No se rechaza Ho y se concluye con un nivel de significancia
de 0.10 que la afirmacin del constructor es cierta.
Problema: El fabricante de una patente mdica sostiene que la misma tiene un 90 % de
efectividad en el alivio de una alergia, por un periodo de 8 hrs. En una muestra de 200
individuos que tenan la alergia, la medicina suministrada alivio a 160 personas. Determinar
si la aseveracin del fabricante es cierta. El nivel de significancia es 0.01
Solucin:
1. Se trata de una distribucin muestral de proporciones.
2. Datos:
P = 0.90
p = 160 / 200 = 0.8
n = 200
= 0.01
3. Ensayo de hiptesis
H0 : p = 0.9
H1 : p < 0.9
4. Regla de decisin
Z < -2.33 se acepta H1 y se rechaza H0
Z -2.33 se acepta H0
5. Clculos
221
Z=
pP
=
Pq
n
0.8 0.90
= 4.71
(0.90)(0.10)
200
6. justificacin y decisin
- 4.71 < - 2.33 se acepta H1 y se rechaza H0 . se concluye que es menor al 90 % de
efectividad
Problema: Un fabricante de semiconductores produce controladores que se emplean en
aplicaciones de motores automovilsticos. El cliente requiere que la fraccin de controladores
defectuosos en uno de los pasos de manufactura crticos no sea mayor que 0.05, y que el
fabricante demuestre esta caracterstica del proceso de fabricacin con este nivel de calidad,
utilizando =0.05. El fabricante de semiconductores toma una muestra aleatoria de 200
dispositivos y encuentra que cuatro de ellos son defectuosos. El fabricante puede
demostrar al cliente la calidad del proceso?
Solucin:
1. Se trata de una distribucin muestral de proporciones.
2. Datos:
P = 0.05
p = 4/200 = 0.02
n = 200
= 0.05
3. ensayo de hiptesis
H 0 : P = 0.05
H1 : P < 0.05
222
4. Regla de decisin:
Si ZR -1.645 No se rechaza Ho
Si ZR < -1.645 Se rechaza Ho
5. Clculos:
Z=
pP
=
Pq
n
0.02 0.05
= 1.946
(0.05)(0.95)
200
6. Justificacin y decisin:
Puesto que 1.946<-1.645, se rechaza Ho y se concluye con un nivel de significancia del
0.05 que la fraccin de artculos defectuosos es menor que 0.05.
P2
223
4. Regla de decision.
P=
x1 + x2 253 + 196
=
= 0.7483
n1 + n2 300 + 300
P = P1 = P2 = 0.7483
q = 1 P = 0.2517
Z=
Z=
( p1 p2 ) ( P1 P2 )
1 1
Pq +
n1 n2
(0.8433 0.6533) 0
1
1
(0.7483)(0.2517)
+
300 300
= 5.36
6. Justificacin y decisin :
Puesto que 5.36 > 2.575 se rechaza la hiptesis nula y se concluye con un nivel de
significancia de 0.01 que los dos fluidos para pulir son diferentes.
Problema: Se tomar el voto entre los residentes de una ciudad y el condado
circundante para determinar si se debe construir una planta qumica propuesta. El lugar
de construccin est dentro de los lmites de la ciudad y por esta razn muchos votantes
del condado consideran que la propuesta pasar debido a la gran proporcin de
votantes que favorecen la construccin. Para determinar si hay una diferencia
224
Si Z 1.96 se acepta Ho
Si Z > 1.96 Se acepta H1
5. Clculos
P=
Z=
x1 + x2 120 + 240
=
= 0.48
n1 + n2 200 + 500
( p1 p2 ) ( P1 P2 )
1 1
Pq +
n1 n2
(0.60 0.48) 0
1
1
(0.51)(0.49)
+
200 500
= 2.9
6. Justificacin y decisin :
Puesto que 2.9 > 1.96 se acepta H1 y se concluye estar de acuerdo en que la proporcin
de votantes de la ciudad a favor de la propuesta es ms alta que la proporcin de
votantes del condado..
225
UNIDAD 5
REGRESION Y
CORRELACION.
Objetivo:
Comprender
correlacin
el
y
concepto
regresin,
de
los
5.1 Introduccin.
A menudo, en la prctica, se requiere resolver problemas que incluyen conjuntos de
variables
cuando se sabe que existen algunas relaciones inherentes entre ellas. Por
ejemplo, en una situacin industrial se puede saber que el contenido de alquitrn en el flujo
saliente de un proceso qumico se relaciona con la temperatura de entrada. Ya que una de
las aplicaciones ms importantes de la estadstica implica la estimacin del valor medio de
una variable de respuesta y o la prediccin de algn valor futuro y con base en el
conocimiento de un conjunto de variables independientes relacionadas,
x1 , x2 ,..., xk .
Mn3O4 vara
con la temperatura de
T ( K)
Cp
280
32.7
650
45.4
1000
52.15
1200
53.7
1500
52.9
1700
50.3
60
40
20
0
0
500
1000
Temperatura
1500
2000
217
trabajo a una computadora y el momento en que se completa, con variables tales como el
numero y el tamao de los trabajos que ya estn esperando para ejecutarse y el tamao de
los trabajos que se estn presentando ( las variables independientes). El objetivo sera
crear una ecuacin de prediccin (o un modelo) que exprese y como una funcin de las
variables independientes. Esto permitira la gerente predecir y para valores especficos de
las variables independientes y, en ltima instancia, utilizar los conocimientos derivados de un
estudio de la ecuacin de prediccin para instaurar polticas de control del tiempo de espera.
Los modelos que se emplean para relacionar una variable dependiente y con las variables
independientes x1 , x2 ,..., xk se denominan modelos de regresin o modelos estadsticos
lineales porque expresan el valor medio de y para valores dados de x1 , x2 ,..., xk como una
funcin lineal de un conjunto de parmetros desconocidos.
Definicin
La variable por predecir (o por modelar), y , es la variable dependiente (o de respuesta)
Definicin
Las variables que se utilizan para predecir (o modelar)
y se denominan variables
218
independiente x y una sola variable Y, los datos se pueden representar mediante los pares
de observaciones
( xn , yn ) .
y = a0 + a1x +
En donde
a0
E = y a0 a1 x
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado
Entonces, podramos escoger un modelo que relacione a y con x trazando una lnea resta
a travs de los puntos de la figura. Semejante modelo deterministico
uno que no
contempla errores de prediccin podra ser adecuado si todos los puntos de la figura,
quedaran sobre la lnea ajustada. Sin embargo, es evidente que esta situacin ideal no
ocurre para los datos de la tabla. Sin importar como tracemos una lnea recta desviaran
significativamente de la lnea ajustada.
, es decir,
y = a0 + a1x +
219
Donde
a0
modelo. Si suponemos que los puntos se desvan por encima y por debajo de la lnea de
medias, siendo algunas desviaciones positivas, otras negativas, y con E ( ) = 0 entonces el
valor medio de y es
E( y) = E(a0 + a1 x + )
= a0 + a1 x + E( )
= a0 + a1 x
Por tanto, el valor medio de y para un valor dado de x, representado por el smbolo E (y), *
se grafica como una lnea recta con ordenada al origen igual a
supuestos, que se resumirn a continuacin, son bsicos para todo anlisis de regresin
estadstico.
errores a lo largo de una serie infinitamente larga de experimentos es 0 para cada valor de la
variable independiente x. Este supuesto implica que el valor medio de y , E ( y ) , para un
valor dado de x es
E( y) = a0 + a1x
Supuesto II: La varianza de la distribucin de probabilidad de
los valores de x.
es normal.
Supuesto IV: Los errores asociados a cualesquier dos observaciones distintas son
220
x1 , x2
y x3 .
Observe que las distribuciones de frecuencia relativa de los errores son normales, con una
media de 0 y una varianza constante de . La lnea recta de la figura es el valor medio y
2
En la prctica, los supuestos no tienen que cumplirse al pie de la letra para que los
estimadores de mnimos cuadrados y las estadsticas de prueba (que se describirn ms
adelante) tengan el grado de con fiabilidad que esperamos de un anlisis de regresin.
Los valores de x (en unidades de 10 libras por pulgada cuadrada) y las magnitudes de
compresin resultantes y (en unidades de 0.1 pulgada) se presentan en la tabla.
221
X
1
Comprensin
5
4
3
2
1
0
0
Presin
Supongamos que creemos que el valor de y tiende a aumentar de forma lineal conforme x
aumenta.
222
y = a0 + a1 x
Polinomio de segundo grado o cuadrtico:
y = a0 + a1 x + a2 x 2 + e
Una extensin til en la regresin lineal es el caso en que y es una funcin lineal de dos o
ms variables. Por ejemplo, y pudiera ser una funcin lineal de x1 y x 2 , de la forma:
y = a0 + a1 x1 + a2 x2
5.3.2. Modelos
Algoritmo de la solucin
1. Inicio
2. Solicitud de los datos discretos ( tabla de datos encontrados experimentalmente) a
los cuales se le va a encontrar la recta que de aproxima mas a ellos.
3. Calcular con base a los datos dados el valor de n.
y
Encontrar la sumatoria x
4. encontrar la sumatoria
5.
xy
Encontrar la sumatoria de la potencia x
223
Si queremos escoger la lnea recta "de mejor ajuste" para un conjunto de datos, debemos
estimar los parmetros desconocidos
a0
a1
a0 y a1 son idnticos.
y = a0 + a1 x
a1 =
n xi y i xi y i
n xi2 ( xi )
a0 = y a1 x
224
UNIDAD
D V / REGR
RESIN Y CORREL
LACIN.
X
1
2
3
4
5
6
7
y
0.5
2.5
2.0
4.0
3.5
6.0
5.5
Solucin:
Problema:
Las
bode
egas
mode
ernas
utiliza
an
vehculo
os
guiados
computariizados
225
en minutos
0.02
0.01
0.01
0.01
0.03
0.03
vehculos
en minutos
0.02
10
0.04
11
0.04
12
0.04
13
0.03
14
0.04
15
0.05
Solucin:
Tiempo de congestionamiento
0.06
0.05
y = 0.00319118x - 0.00400000
0.04
0.03
0.02
0.01
0
-0.01 0
10
15
20
Puntos
Fuerza (kgf) : x
0.120
0.153
0.170
0.225
0.260
Longitud
del
resorte
(m) : y
226
UNIDAD
D V / REGR
RESIN Y CORREL
LACIN.
Aproxime esta
e
informaccin por el mtodo
m
de mnimos cuadrrados, usand
do regresin lineal.
Solucin:
0.300
y = 0.0194x + 0. 1156
5
R2 = 0.9875
0.250
0.200
0.150
0.100
0.050
0.000
0
Mnn3O4 vara
co
on la temperatura de
t
acuerdo a la siguiente tabla:
Punto
T ( K)
280
650
1000
1200
0
150
00
17
700
Cp
32.7
45.4
52.15
53.7
52.9
9
50
0.3
Aproxime esta
e
informaccin por el mtodo
m
de mnimos cuadrrados. Usand
do regresin lineal.
227
y = a0 + a1 x + a2 x 2
a 0 n + a1 xi + a 2 xi2 = y i
a 0 xi + a1 xi2 + a 2 xi3 = xi y i
m=2
n=6
x = 2.5
y = 25.433
x
y
x
x
= 15
= 152.6
2
i
= 55
3
i
= 225
xi
yi
2.1
7.7
13.6
27.2
40.9
61.1
152.6
x
x
x
4
i
= 979
y i = 585 .6
2
i
y i = 2488 .8
228
70
y = 1.853x2 + 2.397x + 2.464
R = 0.998
60
50
40
30
20
10
0
0
y = a0 + a1 x1 + a2 x2
Ahora tenemos el conjunto de ecuaciones normales:
a0 n + a1 x1,i + a2 x2,i = yi
229
y = a0 + a1u + a2 v
Determine los parmetros
a0 , a1
Solucin:
1.2
13800
795.7
12
A :=
1.2 0.1712 1380
81.258
1 0 0 161.336
rref ( A ) = 0 1 0 32.969
0 0 1 0.086
y := 161.336 + 32.969u 0.086v
230
Grafica que muestra las desviaciones de los puntos respectos a una lnea recta.
y = a0 + a1x +
La lnea de medias es
E( y) = a0 + a1x
= a0 + a1x .
representa como y
Entonces, la suma de los cuadrados de las desviaciones de los valores de y respecto a sus
valores estimados para toda las n puntos de datos es
n
2 mide la
231
E( y) = a0 + a1x
parece intuitivamente
Teorema
Sea s = SSE /( n 2). entonces , si se satisfacen los supuestos, la estadstica
2
2 =
SSE
(n 2) s 2
s2 =
2 2
n2
Entonces,
E (s 2 ) =
Donde E(
2
n2
E( 2 )
2 ) = v = (n - 2).
Por tanto,
E (s 2 ) =
2
n2
(n 2) = 2
2.
El procedimiento empleado para calcular SSE puede dar pie a errores de redondeo
considerables. En el siguiente recuadro se presentan la frmula para s2 y un mtodo para
calcular SSE.
Estimacin de
s2 =
SSE
SSE
=
n2
Grados de libertad para error
donde
SSE = ( yi y i ) = SS yy SS xy
2
232
SS yy = ( yi y )
Donde
( y )
= y
n
2
i
= a1
Advertencia: al realizar estos clculos tal vez se sienta tentado a redondear los valores
calculados de SS yy ,
significativas para cada una de estas cantidades a fin de evitar un error importante en el
clculo de SSE.
y = a0 + a1x
Como ilustracin, supongamos que una muestra de datos tiene el diagrama de dispersin
que se muestra en la figura anterior del inciso a. Si suponemos que x no contribuye con
informacin a la prediccin de y, la mejor prediccin de y ser la media de la muestra, y, que
se grafica como una lnea horizontal en la figura inciso b.
233
Los segmentos de lnea verticales trazados en esa figura son las desviaciones de los puntos
respecto de la media y. Observe que la suma de los cuadrados de las desviaciones para el
modelo:
y = y es SS yy = ( yi y ) 2 .
Supongamos ahora que ajustamos una lnea de mnimos cuadrados al mismo conjunto de
datos y marcamos las desviaciones de los puntos respecto de la lnea como se hace en la
figura del inciso c.
Es evidente que:
1. Si x contribuye con poca o ninguna informacin a la prediccin de y , las sumas de
los cuadrados de las desviaciones para las dos lneas,
SS yy = ( yi y ) 2
SSE = ( yi yi ) 2
2. Si x contribuye con informacin a la prediccin de y , entonces SSE ser menor que
SSyy. De hecho, si todos los puntos caen en la lnea de mnimos cuadrados, entonces
SSE = 0.
Una forma cmoda de medir qu tan bien se desempea la ecuacin de mnimos
cuadrados
y = a0 + a1x
cuadrados de las desviaciones que se puede atribuir a x, expresada como una proporcin de
SSyy. Esta cantidad, llamada coeficiente de determinacin, es
SS yy SSE
SS yy
En la regresin lineal simple se puede demostrar que esta cantidad es igual al cuadrado del
coeficiente de correlacin lineal simple r.
234
Definicin:
El coeficiente de determinacin es
r2 =
SS yy SSE
SS yy
= 1
SSE
SS yy
relacin lineal y y x . (En una regresin lineal simple, este coeficiente tambin puede
calcularse elevando al cuadrado el coeficiente de correlacin r )
Observe que r2 siempre est entre 1 y 1, porque r est entre -1 y +1. Por tanto, r2 = 0.60
significa que la suma de los cuadrados de las desviaciones de los valores de y respecto de
sus valores estimados se redujo en 60% al utilizar y , en lugar de y , para predecir y. O bien,
en trminos ms prcticos, r2 = 0.60 implica que el modelo de lnea recta que relaciona a y
con x puede explicar (o dar cuenta de) 60% de la variacin presente en la muestra de
valores de y.
Problema: Calcule el coeficiente de determinacin para el ejemplo de compresin de aislante. Los datos se repiten en la tabla siguiente:
Presin
Compresin
X, 10 libras
Y, 0.1 de
por pulg
pulgada
235
SSyy = y
2
i
(y )
(10)
= 26
5
=6
SSE = ( yi yi ) = 1.10
2
r2 =
(Observe que este valor tambin podra haberse obtenido elevando al cuadrado el
coeficiente de correlacin r = 0.904.)
Ahora sabemos que al usar la presin x para predecir la compresin y con la lnea de
mnimos cuadrados y = -0.1 + 0.7x, la suma total de los cuadrados de las desviaciones de
los cinco valores de y respecto de sus valores estimados se redujo en 82% gracias al
empleo del predictor lineal y . Es decir, 82% de la variacin de los valores de compresin de
la muestra se puede explicar mediante la lnea de mnimos cuadrados.
En situaciones en las que un modelo de regresin de lnea recta resulta ser un predictor
estadsticamente satisfactorio de y, el valor de r2 puede servir al analista de regresin como
gua en la bsqueda de mejores y ms tiles modelos. Por ejemplo, Crandall y Cedercreutz
(1976) emplean un modelo lineal simple para relacionar el costo del trabajo mecnico
(calefaccin, ventilacin y plomera) en la construccin con el rea de piso.
236
a0
Por tanto, el rea de piso debe servirnos para predecir el costo mecnico de una fbrica o
bodega. Sin embargo, el valor del coeficiente de determinacin r2 fue de 0.35. Esto nos dice
que slo 35% de la variacin en los costos mecnicos se puede atribuir a las diferencias en
el rea de piso.
Este valor relativamente pequeo de r2 impuls a Crandall y Cedercreutz a incluir en el
modelo otras variables independientes (por ejemplo, volumen, cantidad de vidrio) en un
intento por dar cuenta de una porcin significativa del 65% restante de la variacin en el
costo mecnico que no puede explicarse con el rea de piso.
237
a1
"asociacin" lineal entre dos variables y y x. Otra forma de medir la asociacin es calcular el
coeficiente de correlacin r del momento de producto de Pearson. El coeficiente de
correlacin, que se define en el recuadro, ofrece una medida cuantitativa de la fortaleza de la
relacin lineal entre x y y en la muestra, como lo hace la pendiente de mnimos cuadrados
a1 .
Definicin :
El coeficiente de correlacin r del momento de producto de Pearson es una medida de la
fortaleza de la relacin lineal entre dos variables x y y en la muestra. El coeficiente se
calcula ( para una muestra de n mediciones de x y y ) como sigue
r=
SS xy
SS xx SS yy
Puesto que tanto r como a1 proporcionan informacin acerca de la utilidad del modelo, no
debe sorprendemos que las frmulas mediante las cuales se calculan sean similares. En
particular, observe que SSxy aparece en los numeradores de ambas expresiones y que, dado
que ambos denominadores siempre son positivos, r y
a1
(ambos positivos o bien ambos negativos). Un valor de r cercano o igual a 0 implica poca o
ninguna relacin lineal entre y y x.
238
Compresin
Y, 0.1 de pulgada
Solucin:
SSxy = 7, SSxx = 10, :
= 10 y
2
i
= 26 .
Entonces,
SS yy = y
2
i
( y )
(10 )
= 26
5
=6
y el coeficiente de correlacin es
r=
SS xy
SS xx SS yy
7
7
=
= 0.904
(10)(6) 7.746
239
Advertencia
Una correlacin elevada no implica causalidad. Si se observa un valor positivo o negativo
grande del coeficiente de correlacin r de la muestra, no es correcto llegar a la conclusin de
que un cambio en x causa un cambio en y. La nica conclusin puede existir una tendencia
lineal entre x y y .
Tenga presente que el coeficiente de correlacin r mide la correlacin entre los valores x y
los valores y de la muestra, y que existe un coeficiente de correlacin lineal similar para la
poblacin de la cual se seleccionaron los puntos de datos.
de esperar,
lugar de estimar
H0:
= 0 contra
Ha:
0,
a1
y el coeficiente de
a1
Por esta razn, recomendamos utilizar la pendiente para hacer inferencias acerca de la
existencia de una relacin lineal positiva o negativa entre dos variables.
Para quienes prefieren probar si hay o no una relacin lineal entre dos variables empleando
el coeficiente de correlacin r, bosquejamos el procedimiento en el recuadro.
240
Ho : = 0
Ho : = 0
H1 : 0
H1 : > 0
( < 0)
Estadstica de prueba: t =
Regin de rechazo:
t > t
r n2
1 r2
Regin de rechazo:
t > t / 2
(t < t )
Donde la distribucin de t depende de (n 2) gl .
Gravedad
Modulo de
Gravedad
Modulo de
especifica, x
ruptura, y
especifica, x
ruptura, y
( g / cm3 )
(kPa)
( g / cm3 )
(kPa)
0.414
29186
0.581
85156
0.383
29266
0.557
69571
0.399
26215
0.550
84160
0.402
30162
0.531
73466
0.442
38867
0.550
78610
0.422
37831
0.556
67657
241
0.466
44576
0.523
74017
0.500
46097
0.602
87291
0.514
59698
0.569
86836
0.530
67705
0.544
82540
0.569
66088
0.557
81699
0.558
78486
0.530
82096
0.577
89869
0.547
75657
0.572
77369
0.585
80490
0.548
67095
Solucin
Sxx = 0.11273;
Syy = 11807324786
Sxy = 34422.75972
r=
34422.75972
= 0.9435
(0.11273)(11807324786)
Un coeficiente de correlacin de 0.9435 indica una buena relacin lineal entre X y Y. Como
r2 = 0.8902, podemos decir que aproximadamente 89% de la variacin en los valores de Y
se explica por una relacin lineal con X.
t=
b
=
s
S xx
SSR
s
r n2
1 r2
242
Problema: Para los datos del ejemplo anterior pruebe la hiptesis de que no hay una
asociacin lineal entre las variables.
Solucin:
1. H o : = 0
2. H1 : 0
3. =0.05
4. Regin critica: t < 2.052 y t > 2.052
5. Calculos
t=
0.9435( 27)
1 ( 0.9435 )
= 14.79,
P < 0.001
6. Decisin
Rechazar la hiptesis de no asociacin lineal.
1 1+ r
ln
2 1 r
Es un valor de una variable aleatoria que sigue de manera aproximada la distribucin normal
con media (1/2) In [(1 +
prueba es calcular
z=
=
1 + 0
n 3 1+ r
ln
ln
2 1 r
1
n 3 (1 + r )(1 0 )
ln
2
(1 r )(1 + 0 )
243
Problema: Para los datos del ejemplo antes de que acabamos de resolver pruebe la
hiptesis nula
de 0.05
Solucin:
1.
.H 0 : = 0.9
2.
H1 : > 0.9
3.
= 0.05
4. Regin critica :
z > 1.645
5. Clculos
z=
26 (1 + 0.9435)0.1
ln
= 1.51
2
(1 0.9435)1.9
P = 0.0655
6. Decisin : Hay en realidad alguna evidencia de que el coeficiente de
correlacin excede 0.9
Relacin no lineal.
244
y = a0 + a1u + a2 v
Solucin:
45
62.5 206.4
7
1 0 0 28.692
rref( A ) = 0 1 0 0.257
0 0 1 0.096
y := 28.692 + 0.257u 0.096v
Problema: Al medir la velocidad (con un tubo de Pitot) en una tubera circular de dimetro
interior de 20 cm, se encontr la siguiente informacin:
245
V ( cm / s )
600
550
450
312
240
R ( cm)
700
600
500
400
300
y = -5.3472x 2 - 3.0667x + 601.71
200
100
0
0
10
246
45000
40000
35000
30000
25000
20000
15000
10000
5000
0
10
15
20
100
y = 35.744x - 361.8
90
80
70
60
50
40
30
20
10
0
0
10
15
247
3.5
3.5
3
y = 1.2386x + 0.8702
2.5
2.5
1.5
1.5
0.5
0.5
0
0
0.5
1.5
0.5
1.5
xi
yi
0.5
2.5
2.0
4.0
3.5
6.0
5.5
Solucin:
8
6
4
2
0
0
248
Ejercicios propuestos
P1. En cada caso, grafique la lnea que pasa por los puntos.
a. (0, 2) Y (2, 6)
b. (0, 4) Y (2, 6)
c.
(0,-2) y (-1,-6)
y = - 2 + 3x
d. y = 5x
e. y = 4 - 2x
P3. Dos procesos para el taladrado hidrulico de roca son el taladrado en seco y el taladrado
hmedo. En un agujero seco se introduce aire comprimido por las varillas de taladrar para
expulsar las partculas e impulsar el martillo; en un agujero hmedo se introduce agua a
presin. Se realiz un experimento para determinar si el tiempo y que se requiere para
taladrar una distancia de cinco pies en roca aumenta con la profundidad x (The American
Statistician, febrero de 1991). Los resultados para una porcin del experimento se muestran
en la siguiente tabla.
pies
0
4.90
25
7.41
50
6.19
75
5.57
100
5.17
125
6.89
150
7.05
175
7.11
249
200
6.19
225
8.28
250
4.84
275
8.29
300
8.91
325
8.54
350
11.79
375
12.12
395
11.02
a)
b)
c)
d)
a1
P4. Se realiz un estudio para modelar el desempeo trmico de los tubos con aletas
integrales empleados en las industrias de refrigeracin y de proceso (Journal of Heat
Transfer, agosto de 1990). En el experimento se utilizaron 24 tubos con aletas integrales de
fabricacin especial, con aletas rectangulares hechas de cobre. Se liber vapor hacia abajo
en cada tubo y se midi el coeficiente de transferencia de calor del lado del vapor (con base
en el rea superficial exterior del tubo). La variable dependiente en este estudio es la tasa de
promocin de la transferencia de calor y, definida como el cociente entre el coeficiente del
lado del vapor del tubo con aletas y el coeficiente del lado del vapor de un tubo liso,
evaluados a la misma temperatura. En teora, la transferencia de calor est relacionada con
el rea de la parte superior del tubo que no est "inundada" por la condensacin del vapor.
Los datos de la tabla son los valores de proporcin de rea no inundada (x) y promocin de
la transferencia de calor (y) registrados para los 24 tubos con aletas integrales.
Proporcin de rea
Promocin de la transferencia de
no inundada, x
calor, y
1.93
4.4
1.95
5.3
1.78
4.5
1.64
4.5
250
a) Determine
1.54
3.7
1.32
2.8
2.12
6.1
1.88
4.9
1.70
4.9
1.58
4.1
2.47
7.0
2.37
6.7
2.00
5.2
1.77
4.7
1.62
4.2
2.77
6.0
2.47
5.8
2.24
5.2
1.32
3.5
1.26
3.2
1.21
2.9
2.26
5.3
2.04
5.1
1.88
4.6
a1
.
P5. La Comisin Federal de Comunicaciones (FCC) de Estados Unidos especifica que las
emisiones electromagnticas radiadas por dispositivos digitales se deben medir en un sitio
de prueba de campo abierto. A fin de verificar la aceptabilidad de un sitio de prueba es
preciso evaluar la atenuacin del sitio (es decir, la prdida de transmisin desde la entrada
de un dipolo de media onda hasta la salida de otro cuando ambos dipolos se colocan sobre
el plano de tierra).
251
Un estudio realizado en un sitio de prueba en Fort Collins, Colorado, produjo los siguientes
datos de atenuacin del sitio (en decibeles) y frecuencia de transmisin (en megahertz) para
dipolos a una distancia de 3 metros.
Atenuacin del sitio y ,dBL
Frecuencia de
Transmisin X, MHZ
50
11.5
100
15.8
200
18.2
300
22.6
400
26.2
500
27.1
600
29.5
700
30.7
800
31.3
900
32.6
1000
34.9
P6. Como parte de un estudio sobre la rapidez de combustin de grafito artificial en un flujo
de aire hmedo, se llevo a cabo un experimento con miras a investigar la difusividad del
oxgeno a travs de una mezcla de vapor de agua (Combustion and Flame, vol. 50, 1983).
Se prepararon muestras de mezclas de nitrgeno y oxgeno con una fraccin molar de agua
de 0.017 a nueve temperaturas distintas, y se midi la difusividad del oxgeno en cada una.
Los datos se reproducen en la siguiente tabla.
Temperatura
Difusividad de oxigeno
1,000
1.69
1,100
1.99
1,200
2.31
1,300
2.65
1,400
3.01
1,500
3.39
1,600
3.79
1,700
4.21
1,800
4.64
252
P7. El equilibrio termogravimtrico (TG ) es una nueva tcnica que se desarroll para evaluar
el comportamiento trmico de los compuestos qumicos. Abou El Naga y Salem (1986)
compararon la tcnica TG con el mtodo estndar de evaluar la estabilidad respecto a la
termooxidacin de aceite, base y sus mezclas aditivas (por ejemplo, aceites de
transformador, de turbina y de transmisin). En cada espcimen de una muestra de 10
aceites base se determin la cantidad y de compuestos oxidativos formados en el punto de
oxidacin empleando la tcnica TG, as como el porcentaje total de productos de oxidacin x
empleando el mtodo estndar. Los resultados del experimento se muestran en la siguiente
tabla.
Aceite
base
compuestos oxidativos y , % en
Mtodo estndar:
Total de productos de oxidacin
peso
X, %
25.4
2.3
27.11
2.5
28.0
2.65
17.9
1.3
18.9
1.45
22.9
1.9
30.8
3.3
18.6
1.4
24.4
2.1
10
29.8
2.9
253
el mtodo estndar.
a1
c) Calcule SSE, S2 y s.
d) Interprete el valor de s.
254
ANEXOS
TABLAS
ANEX
XOS / TAB
BLAS
APNDIC
CE A
Tabla de la dis
stribucin normal
n
(rea
a bajo la currva normal)
z
0,,0
0,,1
0,,2
0,,3
0,,4
0,00
0,5000
0,5398
0,5793
0,6179
0,6554
0,01
0,5040
0,5438
0,5832
0,6217
0,6591
0,02
0
0,,5080
0,,5478
0,,5871
0,,6255
0,,6628
0,03
3
20
0,512
0,5517
0,5910
0,629
93
0,666
64
0,04
0,5160
0,5557
0,5948
0,6331
0,6700
0,05
0,5199
0,5596
0,5987
0,6368
0,6736
0,06
0
0,5239
0,5636
0,6026
0,6406
0,6772
0,07
7
0,527
79
0,567
75
0,606
64
0,644
43
0,680
08
0,08
0,5319
0,5714
0,6103
0,6480
0,6844
0,09
0,5359
0,5753
0,6141
0,6517
0,6879
0,,5
0,,6
0,,7
0,,8
0,,9
0,6915
0,7257
0,7580
0,7881
0,8159
0,6950
0,7291
0,7611
0,7910
0,8186
0,,6985
0,,7324
0,,7642
0,,7939
0,,8212
0,7019
57
0,735
0,767
73
0,796
67
0,823
38
0,7054
0,7389
0,7703
0,7995
0,8264
0,7088
0,7422
0,7734
0,8023
0,8289
0,7123
0,7454
0,7764
0,8051
0,8315
0,715
57
0,748
86
0,779
94
0,807
78
0,834
40
0,7190
0,7517
0,7823
0,8106
0,8364
0,7224
0,7549
0,7852
0,8133
0,8389
1,,0
1,,1
1,,2
1,,3
1,,4
0,8413
0,8643
0,8849
0,9032
0,9192
0,8438
0,8665
0,8869
0,9049
0,9207
0,,8461
0,,8686
0,,8888
0,,9066
0,,9222
85
0,848
0,870
08
0,890
07
0,908
82
0,923
36
0,8508
0,8729
0,8925
0,9099
0,9251
0,8531
0,8749
0,8944
0,9115
0,9265
0,8554
0,8770
0,8962
0,9131
0,9278
0,857
77
0,879
90
0,898
80
0,914
47
0,929
92
0,8599
0,8810
0,8997
0,9162
0,9306
0,8621
0,8830
0,9015
0,9177
0,9319
1,,5
1,,6
1,,7
1,,8
1,,9
0,9332
0,9452
0,9554
0,9641
0,9713
0,9345
0,9463
0,9564
0,9649
0,9719
0,,9357
0,,9474
0,,9573
0,,9656
0,,9726
70
0,937
0,948
84
0,958
82
0,966
64
0,973
32
0,9382
0,9495
0,9591
0,9671
0,9738
0,9394
0,9505
0,9599
0,9678
0,9744
0,9406
0,9515
0,9608
0,9686
0,9750
0,9418
0,952
25
0,9616
0,969
93
0,975
56
0,9429
0,9535
0,9625
0,9699
0,9761
0,9441
0,9545
0,9633
0,9706
0,9767
2,,0
2,,1
2,,2
2,,3
2,,4
0,9772
0,9821
0,9861
0,9893
0,9918
0,9778
0,9826
0,9864
0,9896
0,9920
0,,9783
0,,9830
0,,9868
0,,9898
0,,9922
88
0,978
0,993
34
0,987
71
0,990
01
0,992
25
0,9793
0,9838
0,9875
0,9904
0,9927
0,9798
0,9842
0,9878
0,9906
0,9929
0,9803
0,9846
0,9881
0,9909
0,9931
0,980
08
0,985
50
0,988
84
0,9911
0,993
32
0,9812
0,9854
0,9887
0,9913
0,9934
0,9817
0,9857
0,9890
0,9916
0,9936
2,,5
2,,6
2,,7
2,,8
2,,9
0,9938
0,9953
0,9965
0,9974
0,9981
0,9940
0,9955
0,9966
0,9975
0,9982
0,,9941
0,,9956
0,,9967
0,,9976
0,,9982
43
0,994
0,995
57
0,996
68
0,997
77
0,998
83
0,9945
0,9959
0,9969
0,9977
0,9984
0,9946
0,9960
0,9970
0,9978
0,9984
0,9948
0,9961
0,9971
0,9979
0,9985
0,994
49
0,996
62
0,997
72
0,997
79
0,998
85
0,9951
0,9963
0,9973
0,9980
0,9986
0,9952
0,9964
0,9974
0,9981
0,9986
3,,0
3,,1
3,,2
3,,3
3,,4
0,9987
0,9990
0,9993
0,9995
0,9997
0,9987
0,9991
0,9993
0,9995
0.9997
0,,9987
0,,9991
0,,9994
0,,9995
0,,9997
88
0,998
0,999
91
0,999
94
0,999
96
0,999
97
0,9988
0,9992
0,9994
0,9996
0,9997
0,9989
0,9992
0,9994
0,9996
0,9997
0,9989
0,9992
0,9994
0,9996
0,9997
0,998
89
0,999
92
0,999
95
0,999
96
0,999
97
0,9990
0,9993
0,9995
0,9996
0,9997
0,9990
0,9993
0,9995
0,9997
0,9998
3,,5
0,9998
0,9998
0,,9999 0,999
99
0,9999
0,9999
0,9999
256
ANEXOS / TABLAS
0,00
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
-3.4
-3.3
-3.2
-3.1
-3.0
0.0003
0.0005
0.007
0.0010
0.0013
0.0003
0.0005
0.0007
0.0009
0.0013
0.0003
0.0005
0.0006
0.0009
0.0013
0.0003
0.0004
0.0006
0.0009
0.0012
0.0003
0.0004
0.0006
0.0008
0.0012
0.0003
0.0004
0.0006
0.0008
0.0011
0.0003
0.0004
0.0006
0.0008
0.0011
0.0003
0.0004
0.0005
0.0008
0.0011
0.0003
0.0004
0.0005
0.0007
0.0010
0.0002
0.0003
0.0005
0.0007
0.0010
-2.9
-2.8
-2.7
-2.6
-2.5
0.0019
0.0026
0.0035
0.0047
0.0062
0.0018
0.0025
0.0034
0.0045
0.0060
0.0017
0.0024
0.0033
0.0044
0.0059
0.0017
0.0023
0.0032
0.0043
0.0057
0.0016
0.0023
0.0031
0.0041
0.0055
0.0016
0.0022
0.0030
0.0040
0.0054
0.0015
0.0021
0.0029
0.0039
0.0052
0.0015
0.0021
0.0028
0.0038
0.0051
0.0014
0.0020
0.0027
0.0037
0.0049
0.0014
0.0019
0.0026
0.0036
0.0048
-2.4
-2.3
-2.2
-2.1
-2.0
0.0082
0.0107
0.0139
0.0179
0.0228
0.0080
0.0140
0.0136
0.0174
0.0222
0.0078
0.0102
0.0132
0.0170
0.0217
0.0075
0.0099
0.0129
0.0166
0.0212
0.0073
0.0096
0.0125
0.0162
0.0207
0.0071
0.0094
0.0122
0.0158
0.0202
0.0069
0.0091
0.0119
0.0154
0.0197
0.0068
0.0089
0.0116
0.0150
0.0192
0.0066
0.0087
0.0113
0.0146
0.0188
0.0064
0.0084
0.110
0.0143
0.0183
-1.9
-1.8
-1.7
-1.6
-1.5
0.0287
0.0359
0.0446
0.0548
0.0668
0.0281
0.0352
0.0436
0.0537
0.0655
0.0274
0.0344
0.0427
0.0526
0.0643
0.0268
0.0336
0.0418
0.0516
0.0630
0.0262
0.0329
0.0409
0.0505
0.0618
0.0256
0.0322
0.0401
0.0495
0.0606
0.0250
0.0314
0.0392
0.0485
0.0594
0.0244
0.0307
0.0384
0.0475
0.0582
0.0239
0.0301
0.0375
0.0465
0.0571
0.0233
0.0294
0.0367
0.0455
0.0559
-1.4
-1.3
-1.2
-1.1
-1.0
0.0808
0.0968
0.1151
0.1357
0.1587
0.0793
0.0951
0.1131
0.1335
0.1562
0.0778
0.0934
0.1112
0.1314
0.1539
0.0764
0.0918
0.1093
0.1292
0.1515
0.0749
0.0901
0.1075
0.1271
0.1492
0.0735
0.0885
0.1056
0.1251
0.1469
0.0722
0.0869
0.1038
0.1230
0.1446
0.0708
0.0853
0.1020
0.1210
0.1423
0.0694
0.0838
0.1003
0.1190
0.1401
0.0681
0.0823
0.0985
0.1170
0.1379
-0.9
-0.8
-0.7
-0.6
-0.5
0.1841
0.2119
0.2420
0.2743
0.3085
0.1814
0.2090
0.2389
0.2709
0.3050
0.1788
0.2061
0.2358
0.2676
0.3015
0.1762
0.2033
0.2327
0.2643
0.2981
0.1736
0.2005
0.2296
0.2611
0.2946
0.1711
0.1977
0.2266
0.2566
0.2578
0.1685
0.1949
0.2236
0.2546
0.2877
0.1660
0.1922
0.2206
0.2514
0.2843
0.1635
0.1894
0.2177
0.2483
0.2810
0.1611
0.1867
0.2148
0.2451
0.2776
-0.4
-0.3
-0.2
-0.1
-0.0
0.3446
0.3821
0.4207
0.4602
0.5000
0.3409
0.3783
0.4168
0.4562
04960
0.3372
0.3745
0.4129
0.4522
0.4920
0.3336
0.3707
0.4090
0.4483
0.4880
0.3300
0.3669
0.4052
0.4443
0.4840
0.3264
0.3632
0.4013
0.4404
0.4801
0.3228
0.3594
0.3974
0.4364
0.4761
0.3192
0.3557
0.3936
0.4325
0.4721
0.3156
0.3520
0.3897
0.4286
0.4681
0.3121
0.3483
0.3859
0.4247
0.4641
257
ANEXOS / TABLAS
APNDICE B
Valores crticos de la distribucin t
V
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
0.40
0.325
0.289
0.277
0.271
0.267
0.265
0.263
0.262
0.261
0.260
0.260
0.259
0.259
0.258
0.258
0.258
0.257
0.257
0.257
0.257
0.257
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.256
0.255
0.254
0.254
0.253
0.30
0.727
0.617
0.584
0.569
0.559
0.553
0.549
0.546
0.543
0.542
0.540
0.539
0.537
0.537
0.536
0.535
0.534
0.534
0.533
0.533
0.532
0.532
0.532
0.531
0.531
0.531
0.531
0.530
0.530
0.530
0.529
0.527
0.526
0.524
0.20
1.376
1.061
0.978
0.941
0.920
0.906
0.896
0.889
0.883
0.879
0.876
0.873
0.870
0.868
0.866
0.865
0.863
0.862
0.861
0.860
0.859
0.858
0.858
0.857
0.856
0.856
0.855
0.855
0.854
0.854
0.851
0.848
0.845
0.842
0.15
1.963
1.386
1.250
1.190
1.156
1.134
1.119
1.108
1.100
1.093
1.088
1.083
1.079
1.076
1.074
1.071
1.069
1.067
1.066
1.064
1.063
1.061
1.060
1.059
1.058
1.058
1.057
1.056
1.055
1.055
1.050
1.045
1.041
1.036
0.10
3.078
1.886
1.638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1.363
1.356
1.350
1.345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282
0.05
6.314
2.920
2.353
2.132
2.015
1.943
1.895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.671
1.658
1.645
0.025
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.145
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.000
1.980
1.960
258
ANEXOS / TABLAS
V
1
2
3
4
5
0.02
15.895
4.849
3.482
2.999
2.757
0.015
21.205
5.643
3.896
3.298
3.003
0.01
31.821
6.965
4.541
3.747
3.365
0.0075
42.434
8.073
5.047
4.088
3.634
0.005
63.657
9.925
5.841
4.604
4.032
0.0025
127.322
14.089
7.453
5.598
4.773
0.0005
636.590
31.598
12.924
8.610
6.869
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
2.612
2.517
2.449
2.398
2.359
2.328
2.303
2.282
2.264
2.249
2.235
2.224
2.214
2.205
2.197
2.189
2.183
2.177
2.172
2.167
2.162
2.158
2.154
2.150
2.147
2.125
2.099
2.076
2.054
2.829
2.715
2.634
2.574
2.527
2.491
2.461
2.436
2.415
2.397
2.382
2.368
2.356
2.346
2.336
2.328
2.320
2.313
2.307
2.301
2.296
2.291
2.286
2.282
2.278
2.250
2.223
2.196
2.170
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2.567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.390
2.358
2.326
3.372
3.203
3.085
2.998
2.932
2.879
2.836
2.801
2.771
2.746
2.724
2.706
2.689
2.674
2.661
2.649
2.639
2.629
2.620
2.612
2.605
2.598
2.592
2.586
2.581
2.542
2.504
2.468
2.432
3.707
3.499
3.355
3.250
3.169
3.106
3.055
3.012
2.977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.660
2.617
2.576
4.317
4.029
3.833
3.690
3.581
3.497
3.428
3.372
3.326
3.286
3.252
3.222
3.197
3.174
3.153
3.135
3.119
3.104
3.091
3.078
3.067
3.057
3.047
3.038
3.030
2.971
2.915
2.860
2.807
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4.140
4.073
4.015
3.965
3.922
3.883
3.849
3.819
3.792
3.768
3.745
3.725
3.707
3.690
3.674
3.659
3.646
3.551
3.460
3.373
3.291
259
ANEXOS / TABLAS
APNDICE C
Tabla de valores crticos de la distribucin ji cuadrada
260
ANEXOS / TABLAS
261
BIBLIOGRAFIA.
262