Documentos de Académico
Documentos de Profesional
Documentos de Cultura
y estadstica
para ingeniera
y administracin, /
Tercera edicin en ingls
(Segunda edicin en espaol)
William W. &es
Associate Director& Graduate Programs
School o f Industrial and Systems Engineering
Georgia Institute of Technology
Douglas C. Montgomery
Department of Industrial and Management Systems Engineering
Arizona State University
TERCERA REIMPRESIN
MXICO, 1996
793YO
/
c
773
m
/o
Revisin tcnica:
Fsico Juan Carlos Iracheta
Facultad de Ciencias UNAM
Probabilidad y estadstica para ingeniera y administracin
Derechos reservados respecto a la segunda edicin en espafol:
O 1993, COMPARIA EDITORIAL CONTINENTAL, S.A. de C.V
Renacimiento 180, Colonia San Juan Tlihuaca,
Delegacin Azcapotzalco, Cdigo Postal 02400, MCxico, D.F.
Miembro de la Cmara Nacional de la Industria Editorial.
Registro nm. 43
Prlogo
viii
PR~LOGO
Cada nuevo concepto en el libro se ilustra por medio de uno o mhs ejemplos
numricos. Nuestra experiencia partir
a
de laprimera y segunda edicioneses que
los ejemplos son una parte importante del texto y deben estudiarse con cuidado.
En muchos casos, hemos tomado ejemplos de la bibliografa ya publicada para
ilustrar laextensa gama de aplicaciones potenciales de la metodologa estadstica
en la toma de decisiones de la ingeniera y la administracin. Los problemas de
tarea desempeilan un papel integral en los cursos de probabilidad y estadstica
aplicadas. El libro contiene mhs de 500 ejercicios, que van de los problemas
computacionales a las extensiones de la metodologa bsica. Las especificaciones
y los datos de muchos de estos ejemplos se han extrado de aplicaciones reales
de la estadstica y la probabilidad.
El libro puede utilizarse de diversas maneras. Nosotros lo hemos empleado
para un curso de unoo dos semestres de estadstica en ingeniera
para el segundo
afio de los estudios universitarios. Este curso se enfoca a los siguientes temas:
La presencia de la variabilidad en el mundo real de los problemas de
ingeniera y administracin.
El valor de los mtodos grhficos en el anlisis de datos.
La importancia del planteamiento estadstico en la toma de decisiones
cuando la variabilidadse presenta.
El valor de los experimentos diseados estadsticamente y los fundamentos de los disefos factoriales y factorial-fraccionales.
El papel de herramientas estadsticas tales como experimentos destinados
al diseoy desarrollo de producto, as como al desarrollo y mejoramiento
del proceso.
La filosofa ylos mtodos de Shewhart, Juran,Deming y otros en relacin
con el mejoramiento continuo de procesos, y el desarrollo y entrega de
productos y servicios de calidad.
Este cursodeun
semestre se inicia con la introduccin al campo de la
probabilidad y la estadstica en el captulo
1, destacando los mtodos grhficosdel
anhlisis de datos; los estudios de temas de probabilidad aplicada en los captulos
2 al 18, centrados en las propiedades y aplicaciones de varias distribuciones
discretas y continuas importantes (binomial, Poisson, normal, exponencial, lognormal y de Weibull), presentan el intervalo de confianza y los procedimientos
de prueba de hiptesis en los captulos 10 y 11, analizan los mtodos del diseo
de experimentos en los captulos 12 y 13 subrayando el concepto de disefio
factorial, y concluyen con una introduccin a los diagramas de control y el control
de procesos estadsticos a partir del captulo 17. En trminos de horas de clase,
dedicamos alrededor del 15 por ciento del tiempo a laintroduccin y la estadstica
descriptiva, 20 por ciento a temas de probabilidad y de distribuciones importantes, 20 por ciento a los intervalos de confianza y la prueba de hiptesis, 25 por
ciento al disefo de experimentos y 20 por ciento a los diagramas de control y el
PR6LOGO
William W. Hines
Douglas C . Montgomery
Contenido
1.
1-1 Elcampodelaprobabilidad
y laestadstica1
1-2
Presentacin
grfica
de
datos
4
1-2.1Datos
de medicin:ladistribucindefrecuencia
y el histograma
5
8
1-2.2Datos
de conteo: el diagramadepareto
1-3
Descripcin
numrica
de
datos
10
1-3.1
Medidas
de tendencia
central
10
de
dispersibn
13
1-3.2 Medidas
Datos
agrupados
18
1-3.3
1-4
Antitisis
Exploratorio
de
datos
20
1-4.1
El Diagrama
de
hrbol
21
1-4.2
El Diagrama
de
caja
23
1-5 Resumen
25
1-6
Ejercicios
25
2.
Introduccin a
2-1
la probabilidad
Introduccin
33
Repaso
de
conjuntos
34
Experimentosyespaciosmuestrales
38
2-3
2-4
Eventos
42
2-5 Definicindeprobabilidad y asignacin43
2-6
Espaciosmuestralesfinitosyconteo49
50
2-6.1
Diagrama
de hrbol
2-6.2
Principio
multiplicacin
de
50
Permutaciones
2-6.3
51
Combinaciones
2-6.4
52
55
2-6.5
Permutaciones
con
objetos
similares
2-7 Probabilidad
condicional
55
2-8
Particiones,probabilidadtotal y teoremadeBayes63
2-9
Resumen
65
2-10 Ejercicios
66
2-2
33
xii
3.
CONTENIDO
Variablesaleatoriasunidimensionales
73
Introduccin
3-1
73
3-2
La
funcin
de
distribucin
77
3-3
Variables
aleatorias
discretas
80
3-4
Variables
aleatorias
continuas
84
3-5
Algunas
caractersticas
de
las
distribuciones
87
3-6
Desigualdad
de
Chebyshev
92
Resumen
3-7
94
95
Ejercicios
3-8
4.
y esperanza
Introduccin
4-1
99
Eventos
4-2 equivalentes
99
4-3Funcionesdeunavariablealeatoriadiscreta1
4-4Funcionescontinuasdeunavariablealeatoriacontinua104
Esperanza
4-5107
4-6Aproximacionesa
E(H(X))y V(H(X))
111
4-7
La
Funcin
generatriz
de
momentos
114
Resumen
4-8
117
4-9 Ejercicios
118
probabilidad
5.conjunta
Distribuciones
de
99
O1
125
5-1
Introduccin
125
Distribucin conjunta para variables aleatorias bidimensionales 126
marginales
131
5-3 Distribuciones
Distribuciones
condicionales
136
5-4
condicional
141
5-5 Esperanza
Regresin
de la media
143
5-6
Independenciadevariablesaleatorias145
5-7
Covarianza y correlacin
147
5-8
5-9 Funcin de distribucin para variables aleatorias bidimensionales
150
5-10 Funcionesde dos variablesaleatorias152
>2
155
5-1 1 Distribucionesconjuntasdedimensinn
lineales
157
5-12 Combinaciones
5-13 Funciones generadoras de momentos y combinaciones lineales 161
5-14 Leyde los grandesnmeros162
5-15 Resumen
165
165
5-1 6 Ejercicios
5-2
6.
distribuciones
Algunas
discretas
importantes
In?roduccin
6-1 173
6-2
Er sayos y distribucin de Bernoulli173
Distribucin
6-3
binomial
176
173
CONTENIDO
xiii
y varianza de ladistribuci6nbinomial177
6-3.1Media
6-3.2 Distribuci6n
binomial
acumulativa
179
6-3.3
Una
aplicaci6n
de la
distribuci6n
binomial
179
6-4
Distribucin
geometrica
182
Media y varianzade la distribuci6ngeombtrica183
6-5
Distribucin
de
Pascal
185
Media y varianza de la distribuci6n de Pascal185
multinomial
186
6-6 Distribucin
6-7
Distribucin
hipergeomtrica
187
Media y varianzade la distribuci6nhipergeombtrica188
Distribucin de Poisson
189
6-8
6-8.1Desarrollo
a partir delProcesodePoisson189
6-8.2Desarrollo
de la distribuci6ndePoisson a partir dela binomial 191
6-8.3
Media y varianza de la distribuci6n de Poisson191
6-9
Algunas
aproximaciones
194
6-1 O Generacin
de
conversiones
195
6-11 Resumen
195
197
6-1 2 Ejercicios
7.
Introduccin
7-1 203
Distribucin
7-2
uniforme
203
Media y varianza de ladistribucinuniforme204
Distribucin
7-3
exponencial
206
la distribuci6nexponencial y ladistribuci6n
7-3.1Relaci6nentre
Poisson
de 206
7-3.2Media
y varianza de ladistribuci6nexponencial208
7-3.3Propiedad
de falta dememoriade la distribuci6nexponencial
7-4
Distribucin
gamma
21
1
7-4.1
Funci6n
gamma
21
1
7-4.2
Definicibn
de la distribucidn
gamma
212
7-4.3Relaci6nentreladistribuci6ngamma
y la distribuci6n
exponencial
212
7-4.4 Media y varianza de ladistribucidngamma213
7-5
Distribucin
de
Weibull
215
Media y varianza de ladistribuci6n de Weibull216
7-6
Generacin
de
conversiones
21
7
Resumen
7-7
218
Ejercicios
7-8
220
8.
Distribucin
normal
Introduccin
225
Distribucin
8-2
normal
225
8-2.1
Propiedades
de
la distribuci6n
normal
226
8-2.2Media
y varianzadeladistribuci6nnormal227
8-2.3
Distribucin
normal
acumulativa
228
8-2.4
Distribucidn
normal
estandar
228
8-2.5
Procedimiento
para
la
solucin
de
problemas
229
8-3
Propiedad
reproductiva
de
la
distribucin
normal
234
8-1
203
21 1
225
xiv
CONTENIDO
8-4
Teorema
central
del
lmite
237
8-5Aproximacinnormalaladistribucinbinomial241
Distribucin
8-6
lognormal
245
8-6.1
Funcibn
de densidad
245
8-6.2Media
y varianza de ladistribuci6nlognormal245
8-6.3
Otros
momentos
246
8-6.4
Propiedades
de
la
distribuci6n
lognormal
247
8-7
Distribucin
normal
bivariada
249
8-8 Generacin
de
conversiones
normales
254
Resumen
8-9255
8-10
Ejercicios
255
9.
263
Muestras
9-1 aleatorias
263
9-2
Estadisticas
y distribuciones
de
muestreo
264
9-3
Distribucin
cuadrada
ji
266
t
27.0
9-4
Distribucin
Distribucin
9-5
F
274,)
Resumen
9-6277
Ejercicios
9-7278
I O . Estimacin de parmetros
283
10-1 Estimacin
por
puntos
283
10-1.I Propiedadesde los estimadores285
10-1.2 MItodo de maxima
similitud
290
10-1.3
MBtodo
de momentos
293
10-1.4Precisidndelaestimaci6n:
el error estdndaq 295
10-2Estimacindelintervalodeconfianza296
10-2.1 Intervalodeconfianzasobrelamedia,conocidalavarianza298
10-2.2 Intervalo de confianza sobre la diferencia en dos medias, conocida la
varianza
301
10-2.3 Intervalo de confianza sobre la mediade una distribucibn normal con
varianza
desconocida
304
10-2.4 Intervalo de confianza sobre la diferencia en medias de dos distribucionesnormales,desconocidaslasvarianzas307
- pz para observaciones en
10-2.5 Intervalo de confianza sobre
310
pares
10-2.6 Intervalo de confianza sobre la varianza deuna distribucibn
normal
312
de dos distribucio10-2.7 Intervalo de confianza sobre la razdn de varianzas
nes
normales
314
10-2.8 Intervalo de confianzasobreunaproporci6n316
10-2.9 Intervalo de confianza sobre la diferencia en dos proporciones 318
10-2.10 Intervalos de confianza aproximados en la estimacibn de maxima Si320
militud
10-2.11Intervalos de confianzasimultdneos321
324
10-3 Resumen
324
10-4 Ejercicios
CONTENIDO
xv
335
Introduccin
11-1
335
11-1.I Hip6tesis
estadsticas
335
337
11-1.2Errores de tipo I y tipo II
11-1.3. Hip6tesisunilaterales y bilaterales340
11-2Pruebasdehiptesissobrelamedia,convarianzaconocida343
11-2.1
Analisis
estadstico
343
11-2.2Elecci6ndeltamaiio
de lamuestra345
11-2.3 Relaci6n entre la prueba de hip6tesis y los intervalos de
confianza
349
11-2.4Pruebademuestrasgrandesconvarianzadesconocida349
349
11-2.5 Valores de P
11-3 Pruebas de hiptesis sobre la igualdad de dos medias con varianzas
conocidas
350
11-3.1
Analisis
estadstico
350
11-3.2Elecci6n del tamaiio de lamuestra352
11-4 Pruebas de hiptesis sobre la media de una distribucin normal, con
varianza
desconocida
354
11-4.1
Analisis
estadstico
355
11-4.2Eleccidndeltamaiiodelamuestra356
11-5 Pruebas de hiptesis sobre las medias de dos distribuciones normales,
con
varianzas
desconocidas
358
11-5.1Caso 1: o? = o $= '
o
359
o? + o $ 360
11-5.2Caso2:
11-5.3Eleccidn del tamaiio de lamuestra362
11-6Prueba
t porpares363
11-7Pruebasdehiptesissobrelavarianza366
11-7.1Procedimientosdepruebapara
una poblaci6nnormal367
11-7.2Elecci6n del tamaiio de lamuestra368
11-7.3Procedimientodepruebade
una muestragrande369
11-8Pruebasparalaigualdaddedosvarianzas370
11-8.1Procedimientodepruebaparapoblacionesnormales370
11-8.2Eleccidndeltamaiiodelamuestra372
11-8.3Procedimientodepruebadeunamuestragrande372
11-9Pruebasdehiptesissobreunaproporcin373
11-9.1
Analisis
estadstico
373
11-9.2Eleccidndeltamallodelamuestra374
11-10Pruebasdehiptesissobredosproporciones375
11-10.1 Unapruebade muestragrandepara Ho: p1 = p2
376
11-10.2Eleccidndeltamaiiodelamuestra377
11.10.3Unapruebademuestrapequellapara
Ho:PI = pz
378
11-11 Pruebadebondaddeajuste
380
11-11.1Pruebadebondaddeajustedela
ji cuadrada381
11-11.2 GrBficade laprobabilidad385
11-11.3Seleccibndelaforma de unadistribucidn387
11-12Pruebasdetablasdecontingencias390
11-13
Resumen
394
11-14Ejercicios395
xvi
CONTENIDO
solo
13.
experimentos
Diseo
devarios
factores
con
451
13-1 Ejemplosdeaplicacionesdeldiseodeexperimentos451
factoriales
454
13-2 Experimentos
13-3 Experimentosfactorialesdedosfactores459
13-3.1Anlisisestadsticodelmodelodeefectosfijos460
13-3.2Verificacin de la suficienciadelmodelo465
13-3.3
Una
observacidn
por
celda
467
13-3.4
Modelo
de efectos
aleatorios
468
13-3.5
Modelo
mixto
470
472
factoriales
generales
13-4 Experimentos
factorial
477
13-5 Diseo
13-5.1
Diseo
2'
477
13-5.2Diseo 2kparafactores k a 3
485
13-5.3
Replica
simple
del diserlo
494
Zk
499
13-6 Confusineneldiseo
2k
504
13-7 RBplicafracciona1deldiseo
13-7.1Fraccinmediadeldiseo2k
505
13-7.2Fraccionesmenores:
el factorialfraccionario 2k-P
51
5
13-8 Resumen
516
13-9 Ejercicios
511
525
532
xvii
CONTENIDO
14-4
Prediccin
de
nuevas
ObseNaciones
539
14-5Medidadeadecuacindelmodeloderegresin541
14-5.1
Anelisis
residual
541
14-5.2Pruebade
la faltadeajuste543
14-5.3
Coeficiente
de determinacidn
547
14-6Transformacionesaunalinearecta547
14-7
Correlacin
548
14-8
Resumen
554
14-9 Ejercicios
554
563
15-1
15-2
15-3
15-4
643
649
xviii
CONTENIDO
16-3.4Comparacidncon
la prueba t
653
16-4Prueba deWilcoxondelasumaderango654
16-4.1
Descripcidn
de
la
prueba
654
16-4.2
Aproximacidn
de muestra
grande
656
f
656
16-4.3Comparacidnconlaprueba
16-5Mtodosnoparamtricosenelanlisisdevarianza656
16-5.1
Prueba
Kruskal-Wallis
656
16-5.2
Transformacidn
de
rango
659
660
16-6 Resumen
661
16-7 Ejercicios
17. Controldecalidadestadsticoeingenieradeconfiabilidad
665
733
744
XIX
CONTENIDO
18-12 Ejercicios
747
19. T e o r a e s t a d s t i c a d e d e c i s i o n e s
19-1Estructura
y conceptosdedecisiones
19-2
Inferencia
Bayesiana
758
19-3
Aplicaciones
a
la
estimacin
760
19-4Aplicacionesalapruebadehiptesis765
19-5
Resumen
767
19-6
Ejercicios
767
Apndice
Tabla I
Tabla I1
Tabla 111
Tabla IV
Tabla V
Diagrama VI
Diagrama VI1
Diagrama Vlll
Tabla IX
Tabla X
Tabla XI
Tabla XI1
Tabla XI11
Tabla XIV
Tabla XV
751
751
771
DistribucidnacumulativadePoisson772
Distribucidnnormalacumulativaestdndar775
777
Puntosporcentualesdeladistribucidn X*
779
Puntosporcentualesdeladistribucidn t
780
Puntosporcentualesdeladistribucidn F
Curvascaractersticasdeoperacidn785
Curvas caractersticas de operacidn para
el andlisis de varianza del modelo
de efectos
fijos
794
el andlisis de varianza del modelo
Curvas caractersticas de operacidn para
de efectos
aleatorios
798
802
ValorescrticosparalapruebaWilcoxondedosmuestras
Valorescrticosparalapruebadelsigno804
805
Valores crticos para la prueba Wilcoxon del rango con signo
Escala de significaci6n para la prueba de rango multiplede Duncan 806
808
Factorespara los diagramas de controldecalidad
Factoresparalmites de toleranciabilaterales809
811
Nmeros
aleatorios
Referencias bibliogrficas
812
815
hdice
827
Captulo 1
Introduccin y descripcin
de datos
1-1 El campo de la probabilidad y la estadstica
La estadstica trata de la seleccin, anlisis y uso de datos con el fin de resolver
problemas. A toda persona, tanto en su ejercicio profesional como
su actividad
en
diaria en contacto con revistas noticiosas, televisin y otros medios, se le ofrece
informacin en forma de datos. Consecuentemente, algunos conocimientos de
estadstica le sern de utilidad a la poblacin en general, pero en particular, el
conocimiento estadfstico servital para ingenieros, cientficos y administradores
debidoaquede
manera rutinaria, manejan y analizan datos. Este libroest
disefiado para aportar a los lectores con orientacin tcnica, las herramientas
bsicasdelaestadsticanecesarias
para ejercer sus profesiones. Adems, la
probabilidad, que estudia las variaciones al azar en diversos sistemas se presentarparaelestudiode
la estadstica inferencia1 y para darsustentoaotras
aplicaciones de la probabilidad y la estadstica en ingenieray ciencias.
La importanciadela
estadfstica en la ingeniera y la administracin ha
quedado manifiesta al involucrarse la industria de los Estados Unidos con la
mejora de la calidad. Muchas compafias estadounidenses se han dado cuenta de
que la baja calidad del producto, manifestada en defectos de fabricacin y en la
baja confiabilidad del producto asociadas con su desempefo de campo, afectan
directamente a la productividad global, a su mercado accionario y a su posicin
competitiva y, en consecuencia, asusganancias.
Un programaacertadode
incremento de la calidad puede eliminar el desperdicio y reducir sobrantes y
trabajos rehechos, abatir necesidades de inspeccin y prueba, bajar prdidas por
garanta y hacer resaltar la satisfaccin del cliente, adems de poder lanzar a la
compaAa a su mercado como productor de alta calidad y bajo precio. La estadstica propicia un criterio para lograr mejoras, debido a que sus tcnicas sepueden
usar para describir y comprender la variabifidud.
CAPITULO 1
La variabilidad existe en todo tipo de procesos. Veamos un ejemplo, consideremos la selecci6n de varios moldes metlicos necesarios en un proceso de
fabricaci6n y obtengamos una medida crtica en cada pieza, tal como el desplazamiento de una corredera. Si el instrumento de medida tiene la resolucin
suficiente, esos desplazamientossern diferentes, es decir, habr variabilidad en
sus medidas.De manera inversa, si contsemos el nmero de defectos en tablillas
de circuitos impresos, hallaramos variabilidad en el nmero de irregularidades,
esto es, en algunos circuitos hallaramos pocas, y en otros, en cambio seran
abundantes. Estas variabilidades estn en todos los medios; por ejemplo, en el
grosor del recubrimiento de 6xido sobre
moldes de silic6n, en la produccin
horaria de un proceso qumico, en el nmero de errores en rdenes de compra y
en el flujo de tiempo que se requiere al ensamblar
motores de avin.
Aunque los casos anteriores son ejemplos de fabricacin y producci6n particulares, las aplicaciones de la probabilidad y la estadstica son numerosas en
todos los casos de la ciencia aplicada en donde existan variaciones y donde las
conclusiones acerca deun sistema estCn basadas en datos observados. En realidad
todo el trabajo experimental tiene esta naturaleza y la variabilidad es el comn
denominador de estosproblemas.
Por quC ocurre la variabilidad?En general, lavariabilidad es resultado de los
cambios que ocurrenen las condiciones en las cuales se hacen las observaciones.
Dentro del contexto de la manufactura, estos cambios pueden ser diferencias en
losmaterialesdemuestras,diferenciasen
la formadetrabajardelagente,
diferenciasenlasvariablesdelproceso,talescomotemperatura,presibn,
o
duraci6n del proceso, as como diferenciasen los factores ambientales, como la
humedad relativa. La variabilidad tambidn ocurre debido al sistema de medida
empleado. Porejemplo, el peso obtenidoen una bscula puede depender dellugar
en donde se coloque, en el plato, el objeto por pesar. El proceso de muestre0
tambiCn puede causar variabilidad. Por ejemplo, supongamos que un lote de 1,000
circuitos integrados tiene exactamente100 defectuosos. Si inspeccionramos los
1,000 chips y si el proceso deinspecci6n fuera perfecto (sin error enla inspeccin
o en las medidas), encontraramoslos 100 defectuosos. Sin embargo, supongamos
que seleccionamos una muestra de
50 unidades. Algunos de &tos podran ser los
defectuosos y podra esperarse que fuese el 10% de a seleccin, aunque podra
ser que fuera el O, 6 el 2, 6 el 12 por ciento los defectuosos, dependiendo de la
muestra particular que sehubiese seleccionado.
Por estadsticay probabilidad entendemos los metodos para describir y modelar la variabilidad ademas permitir
de
la tomade decisiones cuando la variabilidad
est presente. En la estadstica inferencial, por lo general deseamos tomar una
decisi&n acerca de unapoblacin. tCrminopobIacin
El
se refiere a unaco~eccin
de medidas de todos los elementos de un universo, acerca del que deseamos
obtenerconclusiones o tomardecisiones. Por ejemplo, una poblacin puede
consistir en todos los generadores de potencia para computadoras personales
fabricadas durante la semana
pasada por una compaiia determinada. Supongamos
1-1
CAPITULO 1
administradores. Los tres tipos mhs importantes de tcnicas que analizaremos son
la estimacin puntual, la estimacin del intervalo de confianza y la prueba de
hiptesis. Los captulos 9 al 17 y el 19 se refieren al desarrollo de estos procedimientos bhsicos e ilustra su aplicaci6n en una variedad de problemas de toma
de decisiones en la ingeniera y la administraci6n.
Los captulos 2 al 8 presentan los conceptos bsicos de la probabilidad. El
conocimiento de esta ltima facilitar la transici6n de la estadstica descriptiva
al empleodedatos
para tomar decisiones. Especficamente, la probabilidad
conforma la base que permite entender cmo se desarrollan las tecnicas de
deducci6n y de toma de decisiones, por qu funcionan y c6mo las conclusiones
de estas tcnicas deductivaspueden interpretarse y presentarse en forma correcta.
El estudio de laprobabilidad nos ayuda a comprender la incertidumbre asociada
a la interpretacin de la informacin obtenida de una muestra que se ha seleccionado de una poblaci6n particular. En cambio, la teora de la probabilidad
proporciona los fundamentos matemhticos y el lenguaje de la estadstica inferencia1 y da marco alas metodologas utilizadas en la descripci6n de las variaciones
aleatorias de los sistemas. Por esta raz6n, en los captulos 2 al 8 se presentan los
fundamentos empleados en la estadstica inferencia1 y en la descripci6n de la
variaci6n aleatoria y sus efectosen los sistemas de ingeniera. Como ejemplo de
esta ltima situacidn, considrese
la decisi6n de diseAo que enfrentaun ingeniero
al especificarel nmero delneas troncales requeridas para proporcionar un nivel
adecuado de servicio en una instalaci6n de telecomunicaciones, donde las Ilamadas llegan de modo aleatorioy con duraci6n variable. La aplicaci6nde
mCtodos probabilisticos conduce a un modelo analticode este sistema que puede
emplearse para determinar valores de las variables de disefio, talescomo el
nmero de lneas troncales y el nmero de operadores requeridos para proporcionar un nivel especificado deservicio. Algunas aplicaciones de probabilidad y
de procesos estocsticos a estosproblemas se estudian en el captulo 18.
A continuacin, se presentan las tcnicas bsicas de la estadstica descriptiva
que son tiles en los problemas deductivos y de toma de decisiones.
En la secci6n
1-2 se presentan las tcnicas grficas, y en la secci6n 1-3 se desarrollarn algunas
otras para ei resumen numCrico de datos.
1-2
PRESENTAC16N
DATOS GRAFICA DE
ConsidCrense los datos de la tabla 1- I . Estos datos son las resistencias en libras
por pulgada cuadrada (psi) de 100 botellas de vidrio no retornables de un litro de
refresco. Estas observaciones se obtuvieron probando cada botella hasta romperla. Los datos se registraron en el orden en el cual se probaron las botellas, y en
este formato no brindan suficiente informacin acerca de la resistencia al rompimiento de las botellas. No es fcil contestar preguntas tales como cul es la
resistencia promedio al rompimiento? o qu porcentaje de las botellas se
rompe debajo de 230 psi? cuando los datos se presentan en esta forma.
Una distribucin de frecuencia es un resumen ms compacto de datos que las
observaciones originales.Para construir una distribucin de frecuencia, debemos
dividir la gama de los datos en intervalos, que suelen denominarse intervalos de
clase. Si es posible, los intervalosde clase deben serde igual ancho, para
incrementar la informacin visual en la distribucin de frecuencias. Deben
hacerse algunos juicios al seleccionar el nmero de intervalos de clase para dar
una imagen razonable. El nmero de intervalos de clase que se utiliza depende
del nmero de observaciones y de la cantidad de discriminacin o dispersin en
los datos. Una distribucin de frecuencias en la que se emplean muy pocos o
demasiados intervalos declase no ser muy informativa. Encontramos en general
que entre 5 y 20 intervalos es satisfactorio en muchos casos, y que el nmero de
intervalos de clase debe aumentarcon n. La eleccin del nmero de intervalos de
clase aproximadamente igual a la raz cuadrada del nmero de observaciones a
menudo funciona bien en la prctica.
TABLA 1 - 1 . Resistencia al rompimiento en libras por pulgada cuadrada
de 100 botellas de vidrio no retornables de refresco de 1 litro
265
205
263
307
220
268
260
234
299
215
197
286
274
243
231
267
281
265
214
31 8
346
317
242
258
276
300
208
187
264
271
280
242
260
321
228
250
299
258
267
293
265
254
281
294
223
260
308
235
283
277
200
235
246
328
296
276
264
269
235
290
221
176
248
263
231
334
280
265
272
283
265
262
271
245
301
280
274
253
287
258
261
248
260
274
337
250
278
254
274
275
278
250
265
270
298
257
210
280
269
251
CAPTULO 1
de Intervalos
acumulativarelativa
(Psi) Frecuencia
I x < 190
5 x < 210
I x < 230
I
x
250
250 I x < 270
270 I x i 290
290 5 x < 310
x < 330
310 I
330 I x < 350
170
190
210
230
Lote
.o2
.o2
.O4
.O7
.13
.32
.24
.11
.O4
.O3
__
1 .o0
.O6
.13
.26
.58
.a2
.93
.97
1.o0
1-2
PRESENTAC16N G a F l C A DE DATOS
100
CAPiTULO 1
Modelo de avi6n
81
u)
L
2
U
30
10
Partes
Agujeros/
Fuera
ranuras
perfilde
1-l
Abolladuras/
lubricadas
picaduraslmuescas
no
perdidos
Fuera
Piezas
desordenadas
rebabas
secuencia
de
Piezas con
Otros
Tipo de defecto
de los defectosenelementos
CAPITULO 1
10
-~
- r=l
n
Para los datos de resistencia al rompimiento de las botellas en la tabla l . 1, la
media de muestra es
'
1O0
x=
< = 1x i
--
26,406
= 264.06
1O0
1O0
Del examen de la figura 1.1, parece que la media de muestra 264.06 psi es un
valor "tpico" de la resistencia alrompimiento, puesto que ocurre cerca del punto
medio de los datos donde se concentran las observaciones. Sin embargo, esta
impresin puede ser engaiiosa. Sup6ngase que el histograma se parece al de la
figura 1.4. La media de estos datos
sigue siendo una medida de tendencia central,
pero no necesariamente implica quela mayor parte de las observaciones se
concentren alrededor de ella. En general, si consideramos a las observaciones
como si tuvieran unidades de masa, la media de muestra sera exactamente el
centro demasa de los datos. Esto implica que el histograma estar equilibrado de
modo perfecto si se sostiene en la media de muestra.
I1
La mediade la muestraxrepresenta el valor promedio de todas las observaciones en la muestra. Tambidn podemos pensar en el clculo del valor promedio de
todas las observaciones en una poblacin. Este promedio se denomina lamedia
de lapoblacin, y se denota por medio de la letra griegap (mu). Cuando hay un
nmero finito de observaciones (digamos,N> en la poblacin, entonces la media
de la poblacin es
P=
x,
1=1
"
(1-2)
X ( n / Z ) + X([n/ZI+l)
n impar
par
(1-3)
La mediana tiene la ventaja deque no es afectada de maneraconsiderable por los valores extremos. Por ejemplo, supngase que las observaciones de la muestra son
CAPTULO 1
12
Para estos datos, la media de la muestra es 363.43. Es claro que en este caso la
media de la muestra no nos dice mucho acerca la
detendencia central de la mayor
parte de los datos. La mediana, sin embargo, sigue siendo 4, y sta es probablemente una medida de tendencia dentral de mucho mayor significado
la mayor
para
parte de las observaciones.
As como es el valor medio enuna muestra, hay un valor medio en la
poblacin. Definimos E como la mediana de la poblacin; esto es, E es un valor
de la variable tal que, la mitad la
depoblacin se encuentra debajode y la mitad
esta arriba de ella.
El modo es la observacin que ocurrecon mayor frecuenciaen la muestra. Por
ejemplo, el modo delos datos de la muestra
es 2, ya que este valor ocurre cuatroveces, y ningn otro valor se presenta tan a
menudo. Puede haber ms de un modo.
Si los datos son simtricos, entonces coinciden la media y la mediana. Si
ademhs, los datos slo tienen un modo (diremos que los datos son unimodales),
entonces coinciden la media, la mediana y el modo. Si los datos estn sesgados
(asimtricos, con una larga cola en un lado), la media, la mediana y el modo no
coincidirn. Suele encontrarse que
el modo < mediana < media si la distribucin
negaliva
Aslmelria
oposlttva
Astrnetria
Slmlrkca
lzquterda
0)
Figura 1.5
o derecha
bl
ct
1-3
13
es asimtrica hacia la derecha, en tanto que el modo > mediana > media si la
distribucin es asimtrica hacia la izquierda. Vase la figura 1.5.
La distribucin de la media de la muestra se conocebien y es relativamente
fcil trabajar con ella. Adems, la media de la muestra es ms estable que su
mediana, en el sentido de queno vara tanto deuna muestra a otra. En consecuencia, muchas tkcnicas estadsticas analticas usan la media de la muestra. No
obstante, la mediana y el modoson medidas descriptivas tiles.
1-3.2
Medidas de dispersi6n
230
250
190
228
258
240
245
305
265
265
240
260
Ntese que el clculo deS' requiere el calculo de2, n sustracciones, y n elevaciones al cuadrado y la suma de operaciones. Las desviaciones x, - x pueden ser
I ao
O=
Muestra 1
0=
Muestra 2
200
220
O 0
O
240
Medla de la muestra
Figura 1.6
01
280
260
=
248
300
320
CAPTULO 1
14
bastante tediosas al trabajar con ellas, y pueden llevarse varios decimales para
asegurar laprecisin numrica. Una frmula computacional ms eficiente para la
varianza de la muestra se obtiene como sigue:
n
(XI
s2
= i=l
n-1
1 (x;?+ x* - 2XXJ
t2
- r=l
n-1
/I
+ nx2 - 2~
x,'
x,
,=l
r=l
n-1
y puesto queX = ( 1 h ) ~ ; -,x, esta ltima ecuacin se reduce a
n-I
x2
x4
'6
I
180
200
6
4
260
240
220
"
-~"
"
x3
'5
O 0
280
300
320
?D
x = 248
de las
1-3
15
Observaciones
x, -
x, = 190
x2 = 228
x3 = 305
3364
- 58
400 - 20
57
-8
17
12
X, =
240
289= 265
x5
144= 260
x6
Suma
248
(x,
ay
3249
64
Suma = 7510
de la ecuacin 1-4,
I1
,=I
S
(x,-
x>2
-
7510
n-1
1502(psi)2
i [i
x,)2/n
x, -
,2 = r = l
,=1
n-1
=
376,534 - (1488)*/6
1502(~si)~
16
CAPTULO 1
38.76 psi
dm
12.57 psi
S =
32.02 psi
(x,
PI2
1-3
17
R = mx (x,)
- mn (xi)
(1 -7)
El intervalo de la muestra se calculacon mucha facilidad, pero tiene la inconveniencia de que se ignora toda la informacidn que existe entre las observaciones
ms pequea y ms grande. Para tamaos de muestra pequeiios, digamos n S 1O ,
esta prdida de informacin no es demasiado seria en algunas situaciones. El
intervalo tiene una amplia aplicacin en el control de calidad estadstico, donde
los tamaos de muestra de4 5 son comunes y la simplicidad del clculo es una
consideracin importante. Analizaremos el uso del intervalo en problemas de
control de calidad estadstico en el captulo 17.
Ejemplo 1.4 Calcule los intervalos de las dos muestras de resistencia al rompimiento de botellasdados en la pgina 13. Para la primera muestra, encontramos
que
RI = 265 -230 = 35
en tanto que en la segunda
18
CAPITULO 1
cv=
(1-8)
ti
(1-10)
respectivamente.
En un gran nmero de distribuciones de frecuencia, yano es posible determinar las observaciones individuales, sino s610 los intervalos de clase a los cuales
pertenecen. Por ejemplo, vease la distribucibn de frecuencia de las resistencias al
rompimiento de las botellas en la figura1. l . En tales casos, podemos aproximar
la media y l a varianza de la muestra. Esto requiere que supongamos que las
1-3
19
(1-11)
(1-12)
Ejemplo 1.5. Para ilustrar el empleo de las ecuaciones 1-1 1 y 1-12, calcularemos la media y la varianza de la resistencia al rompimiento para los datos
en la distribucin de frecuencia de la tabla 1.2. N6tese que hay c = 9 intervalos
de clase, y que m , = 180,f, = 2, m, = 20Q,f, = 4, m3 = 220,f, = 7, m4 = 240,
f4 = 13, m 5 = 260,fs = 32, m6 = 280,f, = 24, m7 = 300,f, = 11, m8 = 320,
fs = 4, m, = 340, yfs = 3. De tal modo
9
x=
26,460
j-1
5 -
100
264.60 psi
Y
9
S2
==
I=
99
7,091,900 - (26,460)*/100
99
914.99 psi2
N6tese que estos valores son muy cercanos a los obtenidos a partir de los datos
desagrupados.
Cuandolosdatosse
agrupan en intervalosdeclase,
tambiCn esposible
aproximar la mediana y el modo. La medianaes aproximadamente
n + l
"
(1-13)
donde LM es el lmite inferior del intervalo de clase que contiene a la mediana
(denominado clase de la mediana),f, es la frecuencia en la clasede la mediana,
20
CAPTULO 1
M 0 = L,,
+ (-)A
a+b
(1-14)
donde LMo es el lmite inferior de la clase modal (el intervalo de clase con la
frecuencia ms grande), a es elvalor absoluto de la diferencia en frecuencia entre
la clase modal y la clase
precedente, b es valor absoluto de la diferencia en
frecuencia entre la clase modal y la siguiente clase, y A es el ancho de la clase
modal.
Por ltimo, si los datos seagrupan y se cifran
alrededor de un origen arbitrario,
por ejemplo mo, tal que 4 = (mi- m J A , donde A es el ancho del intervalo de
clase y mi es el puntomedio del intervalo de clasejsimo,j = 1,2, . . . ,c, entonces
la media yla varianza de la muestra son aproximadamente
(1-15)
Y
Estas ecuaciones son algunas veces tiles en los experimentos de campo en los
que deben colectarse bastantes datos.
EXPLORATORIO
1-4 ANALISIS
DE DATOS
21
1-4.1
El diagrama de hrbol
Supngase quelos datos estn representados por x,, x2, . . . ,x,, y que cada nmero
consta de almenos dos dgitos.Para construir un diagrama de rbol, dividimos
cada nmeroxien dos partes: un tronco, consistenteen uno o ms delos primeros
dgitos, y una hoja, consistente en los dgitos restantes. Por ejemplo, si los datos
estn compuestos por informacin de defectos porcentuales entre O y 100 en lotes
de obleas desemiconductores, entonces podramos dividir elvalor 76 en el tronco
y en la hoja 6. En general, debemos elegir relativamente pocostroncosen
comparacin con elnmero de observaciones. Suele ser mejor elegirun nmero
entre 5 y 20 troncos. Una vez que se ha elegido un conjunto de troncos, se listan
a lo largo del margen del lado izquierdo del formato y junto a cada tronco las
hojas correspondientes alos valores de los datos observados,se listan en elorden
en el que se encontraron en el conjunto de datos.
xi
x'
(265
+ 265)/2
265
CAPTULO 1
22
Tronco
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
INTRODUCCldN Y DESCRlPCldN
DE
DATOS
Frecuencia
6
1
7
I
7
1
3
O,5,8
3
o,4,5
4
1 , O,8,3
6
5,1,1,4,5,5
7
2,8,2,6,8,3,5
11
4,0,8,0,0,7,8,3,4,8,1
5,5,5,1,2,3,0,0,5,3,8,7,0,0,4,5,9,5,4,7,9
21
8,4,1,4,0,6,6,4,8,2,4,1,7,5
14
0,6,1,0,1,0,0,3,7,3
10
7
4,6,8,9,9,3,0
4
O,8
7,1,
2
7-8
2
1,8
2
7,4
6
1
1 O0
~
24
25
26
27
28
29
30
31
32
33
34
f
2,2,3,5,6,8,8
11
0,0,0,1,3,4,4,7,8,8,8
0,0,0,0,1,2,3,3,4,4,5,5,5,5,5,5,7,7,8,9,921
14
O,1,1,2,4,4,4,4,5,6,6,7,8,8
10
O,O,O, 1 O,
, l . 3,3,6,7
7
O,3,4,6,8,9,9
4
O, 1,7,8
2
7,8
2
1,8
2
4,7
1
6
1O0
~
de
1-4
23
346
CAPTULO 1
24
INTRODUCCI6N Y DESCRlPCldN
DATOSDE
21.49
22.67
24.62
24.18
22.78
22.56
24.46
23.79
22.02
23.83
26.67
25.38
25.49
23.50
25.90
24.98
27.0
20.33
21.67
24.67
22.45
22.28
21.95
20.49
21.81
26.67
25.8
p
.-
23.5
23.66
a2
22.02
20.0 -
1 I
22.62
22.3
21.2 -
24.46
24.32
24.7
..
25.70
25.44
.-a
Mezcla 3
Mezcla 2
21.88
21.49
I
1
23.291
I
21.O8
20.33
Mezcla
debido a quelos bigotes izquierdo y derecho y las longitudes de las cajas izquierda
y derecha alrededor de lamediana son casi simtricas.
El diagrama de caja es til en la comparacin de dos o ms muestras. Para
ilustrarlo, considrense los datos en la tabla 1.3. Los datos tomados de Messina
(1987) representan lecturas de viscosidad en tres diferentes mezclas de material
sin procesar en una lnea de manufactura. Uno de los objetivos del estudio que
Messina analiza es la comparacin de las tres mezclas. La figura 1.1 1 presenta
los diagramas de caja para los datos de viscosidad. Este formato permite la fcil
interpretacin de los datos. La mezcla 1 tiene la mayor viscosidad que la mezcla
2 , y &a presenta mayorviscosidad que lamezcla 3. La distribucin de viscosidad
noes simtrica, y la lecturade viscosidad mxima dela muestra 3 parece
inusualmente grande en comparacin con las otras lecturas. Esta observacin
1-6
EJERCICIOS
25
1-5 Resumen
Este captulo ha proporcionado una introduccin al campo de la probabilidad y
la estadstica, describiendo algunas delas aplicaciones de los mtodos de modelado y anlisis estadsticos y probabilsticos
en la ingeniera y la administracin.
Hemos presentado varios mtodos para la descripcibn y el anlisis grfico de
datos. Las herramientas grficas
importantes que se han cubierto incluyen la
distribucin de frecuencias,el histograma, el diagrama de rbol, y el diagrama de
caja. Los mtodos grficosson tiles principalmente para datos medidos; esto es,
datos que pueden medirse en una escala analtica,o datos de conteo. El diagrama
de Pareto es una forma grfica de utilidad particular para datos de conteo.
Tambin hemos discutido varios mtodos numricos para resumir datos. La
media, la mediana y el modo son formas de describir la tendencia central, la
localizacin o el punto medio de los datos. La varianza, la desviacin estndar,
el intervalo y el intervalo intercuartil son formas con las que sedescribe la
dispersin, la propagacin o variabilidad de los datos. En los captulos siguientes
se explorar la aplicacin de estas tcnicas.
1-6 Ejercicios
1-1
El periododealmacn(vidadeanaquel)de
una pelculafotogrficadealta
velocidad est siendo investigada por un fabricante. Se dispone de los siguientes
datos.
Vida (dias)
Vida (dias)
Vida (das)
125
127
140
135
126
120
121
142
151
160
140
125
124
122
121
127
130
131
141
137
121
127
128
134
140
121
126
124
125
127
Vida (dias)
141
147
150
132
143
121
124
131
141
127
CAPTULO 1
26
1-2
El porcentaje de algodn en una tela utilizada para elaborar camisas para hombre se
presenta a continuacin.Construya un histogramaparalosdatos.
Comente las
propiedades de los datos.
34.2
33.1
34.5
35.6
34.3
35.1
34.7
33.6
33.6
34.7
35.0
35.4
36.2
36.8
35.1
35.3
33.8
34.2
33.4
34.7
34.6
35.2
35.0
34.9
34.7
33.6
32.5
34.1
35.1
36.8
37.9
36.4
37.8
36.6
35.4
34.6
33.8
37.1
34.0
34.1
32.6
33.1
34.6
35.9
34.7
33.6
32.9
33.5
35.8
37.6
37.3
34.6
35.5
32.8
32.1
34.5
34.6
33.6
34.1
34.7
35.7
36.8
34.3
32.7
94.1
93.2
90.6
91.4
88.2
86.1
95.1
90.0
92.4
87.3
86.6
91.2
86.1
90.4
89.1
1-4
87.3
84.1
90.1
95.2
86.1
94.3
93.2
86.7
83.0
95.3
94.1
97.8
93.1
86.4
87.6
94.1
92.1
96.4
88.2
86.4
85.0
84.9
87.3
89.6
90.3
93.1
94.6
96.3
94.7
91.1
92.4
90.6
89.1
88.8
86.4
85.1
84.0
93.7
87.7
90.6
89.4
88.6
84.1
82.6
83.1
84.6
83.6
85.4
89.7
87.6
85.1
89.6
90.
o
90.1
94.3
97.3
96.8
94.4
96.1
98.0
85.4
86.6
91.7
87.5
84.2
85.1
90.5
95.6
88.3
84.1
83.7
82.9
87.3
86.4
84.5
1-6
27
EJERCICIOS
3
4
2
10
6
12
13
10
10
5
4
3
11
14
9
2
7
8
4
2
6
13
6
7
9
5
4
3
7 2
8
7 10
9
11
14
9
8
10
12
3
2
4
6
4
10
8
7
13
14
12
5
10 4
4
8
4
10
14
108
4
7 5
10
2
8
6
10
8
106
4
6
15
4
5
3
2
7
2
6
7 9
3 10
7
9
16
11
13
3
13
3
7
3
2
9
4
6
1
4
13
12
7
4
8
6
2
5
8
4
2
2
3
6
4
4
6
7
17
5
10
8
9
11
7
2
8
10
7
4
3
6
4
8
14
1-5
1-6
Considere los datos deporcentaje de algodn enel ejercicio 1-2. Determine lamedia
de la muestra, la varianza de la muestra, la desviacin estndar de la muestra, la
mediana de la muestra y el modo de la muestra.
1-7
1-8
En Applied Life Data Analysis (Anlisis de datos aplicadoa la vida) (Wiley, 1982),
Wayne Nelson presenta el tiempode falla deun fluido aislante entre electrodosa 34
kv. Los tiempos, en minutos, son como sigue: .19, .78, .96, I .3 I , 2.78, 3.16, 4.15,
4.67, 4.85, 6.50, 7.35, 8.01, 8.27, 12.06, 31.75, 32.52, 33.91, 36.71 y 72.89.
(a) Elabore la distribucin de frecuencias y el histograma para estos datos
( b ) Calcule la media de la muestra, la mediana de la muestra, la varianza de la
muestra y la desviacin estndar de la muestra.
28
1-9
CAPTULO 1
1-10 Un artculo en Technometries (Vol. 19, 1977, p. 425), presenta los siguientes datos
decombustibledemotordevarias
mezclas de
88.5, 87.7, 83.4, 86.7, 87.5, 91.5, 88.6, 100.3, 95.6, 93.3, 94.7, 91.1,
91.0,
94.2, 87.8, 89.9, 88.3, 87.6, 84.3, 86.7, 88.2, 90.8, 88.3. 98.8, 94.2. 92.7,
93.2, 91.0, 90.3, 93.4, 88.5, 90.1, 89.2, 88.3, 85.3, 87.9, 88.6, 90.9, 89.0,
96.1, 93.3, 91.8, 92.3, 90.4, 90.1,93.0, 88.7, 89.9, 89.8, 89.6, 87.4, 88.4,
88.9, 91.2, 89.3, 94.4, 92.7, 91.8, 91.6, 90.4, 91.1, 92.6, 89.8, 90.6, 91.1,
90.4, 89.3, 89.7.90.3, 91.6. 90.5, 93.7, 92.1, 92.2, 92.2, 91.2, 91.0, 92.2.
90.0, 90.7.
(u)
1-6
EJERCICIOS
29
1-16 Construya un diagrama de caja para los datos de produccin en el ejercicio 1-3.
Registro de entrada
Perforaci6n de tarjeta
Tarjeta equivocada
Estaci6n invllida
Nmero de trabajo invllido
Error de tabla
Numero de carga invslido
Nmero de empleado invllido
1-18 La siguiente tabla contiene la frecuencia de ocurrencia de las letras finales enun
artculo del Atlanta Journal. Construya un histograma con estos datos. Alguno de
los conceptos numricos descritos en este captulo tienealgn significado para estos
datos?
n
12
11
11
20
25
q
r
13
12
12
8
O
2
11
12
a
b
c
h
I
k
I
t
U
19
13
1
15
18
20
O
41
O
15
O
Y
z
30
CAPiTULO 1
74.001 mm
74.005
74.003
74.001
73.998mm
74.000
74.006
74.002
1-22 El espesor de tablillas de circuito impreso es una caracterstica muy importante. Una
muestra de ocho tablillas tiene los siguientes espesores (en milsimas de pulgada):
63,61,65,62,61,64,60 y 66. Calcule lamedia, la varianzay la desviacin estandar
de la muestra.Cuales son las unidades de medida para cada estadstica?
1-23 Codificacidn de datos. Considere los datos de espesor de las tablillas de circuito
impreso en el ejercicio1-16.
(a) Suponga que restamos la constante 63 a cada nmero. iCuA1 es el efecto en la
media, la varianzay la desviacin estndar de lamuestra?
( b ) Suponga que multiplicamos cadanmero por 100. Cmo son afectadas la
mediana, la varianza y la desviacin estndar dela muestra?
1-24 Codificacidn de datos. Seay, = a + bxi, i = 1,2, . . . , n, donde a y b son constantes
diferentes de cero. Determinela relacin entre j;. y J, y entre S, y sv.
1-25 Considere la can?idad 2:., (x, -a). Para quC valor de a esta cantidad se minimiza?
1-26 La media ordenada. Suponga quelos datos se arreglan en orden creciente y que se
suprime el LN porcentual de las observaciones de cada extremo,
y se calculala media
de la muestra de los nmeros restantes. La cantidad resultante se denomina media
ordenada. sta, por l o general, se encuentra entre la media de la muestra X y la
mediana de lamuestra? (por qu?).
(a) Calcule la media ordenada al 10% de los datos producidos en el ejercicio 1-3.
( b ) Calcule la media ordenada al 20% de los datos producidos en el ejercicio 1-3 y
comprela con la cantidad encontradaen la parte (a).
1-27 La media ordenada.Suponga que LN no esun entero, Desarrolle un procedimiento
para obtener una mediaordenada.
1-28 Considere los datos del periodo de almacenaje en el ejercicio 1-1. Construya una
1-6
31
EJERCICIOS
116
117
118
x, 115
20 19 15 13 9f 6 4
119
120
121
122
123
124
18
15
10
x,- 3
-4
-1
200
180
f 120 60
240
90 160190
4
30
1-31 Para los dos conjuntos dedatos en los ejercicios 1-29 y 1-30, calcule los coeficientes
de variacin de la muestra.
1-32 Calcule la media, la varianza, la mediana
Intervalo de clase
10IX<20
20 I
x < 30
30 S x < 40
40 I x < 50
50 I
x < 60
x < 70
60 I
70 I
x < 80
80 I x < 90
90 I x < 100
Frecuencia
121
165
184
173
142
120
118
110
90
y el modo,
aproximados dela muestra para los datos en la siguiente distribucin de frecuencias:
Intervalo de clase
-1OIX<O
OIX<lO
lOIX<20
20 S x c 30
30 I x < 40
40 5 x < 50
50 5 x
60
Frecuencia
3
8
12
16
9
4
32
CAPiTULO 1
Frecuencia
600 I
x < 650
650 I
x < 700
700 Ix < 750
750 I x < 800
800 I x < 850
850 I x < 900
900 I: x < 950
41
46
50
52
~~
950 I x -= 1000
1000 I x < 1050
60
64
65
70
72
Captulo 2
Introduccin
a la probabilidad
2-1 Introduccin
El trmino probabilidad ha alcanzado un amplio uso en la vida diaria
para
cuantificarelgradodeconfianzaen
un eventode inters. Hay abundantes
ejemplos tales como las afirmaciones siguientes:
hay una probabilidad delluvia
de 0.2, o la probabilidad de quela computadora personal de marca X llegue a
100,000 horas de operacin sin reparacin es0.75. En este captulo presentaremos la estructura bsica, los conceptos elementales y mtodos para sustentar
enunciados precisos y sin ambigiiedad como los planteados arriba.
El estudio formal de la teora de
la probabilidad se origin en los siglos
diecisiete y dieciocho en Francia y fue motivado por el estudio de los juegos de
azar. Con un soporte matemtico poco formal, la gente vio con algo de escepticismo el campo; sin embargo, este punto de vista empez a cambiar en el siglo
diecinueve cuando un modelo (descripcin) probabilistic0 se desarroll para el
comportamientodelasmolculasen
un lquido.Esto se conocicomo el
movimiento browniano, ya que Robert Brown, botnico ingls, fue el primero
queobservelfenmenoen
1827. En 1905, AlbertEinsteinexplicel
movimiento browniano bajo la hiptesis de que las partculas se sometan a un
bombardeo continuo de moldculas del medio circundante. Estos resultados estimularon de modo considerable el inters en la probabilidad, como lo hizo el
advenimiento del sistema telefnico al final del siglo diecinueve y el principio
del veinte. Puesto que fue necesario
un sistema fsico deconexin para posibilitar
la interconexin de telfonos individuales,con duracin de llamadas e intervalos
de interdemanda que presentaban gran variacin, surgi una fuerte motivacin
para desarrollar modelos probabilsticospara describir este comportamiento del
sistema.
34
CAPTULO 2
INTRODUCClbN A LA PROBABILIDAD
se
= (x:xE
R , O S x S I)
35
+ by = c )
36
CAPTULO 2
INTRODUCC16N
A
LA PROBABILIDAD
Consideraremos ahora algunas operaciones con conjuntos. Sean A y B subconjuntos cualesquiera del conjunto universal U . Entonces
1. El complemento de A (con respecto a U) es el conjunto formado por los
elementos de U que no pertenecen a A. A este conjunto complementario
se le denota
A.Esto es,
A = {x:xE
U , x P A)
D = A U B = (x: x
A o x E B (o de ambos))
2
E
= id, e , J g , . . . , x , . Y , z>
A U B = {a,6, c, e, i, o, u>
A n B = (a}
2 = (4,
5, 6, 7 )
A U B = (1, 2, 3, 4, 61,
A n B = {2},
B = {1,3,5,7>
?={2,4,6)
A U C = {1,2,3,5,7},
=B
BUC= U
A n C = {1,3), B n C = 0
2-2
37
REPASO DE CONJUNTOS
Figura 2.1
Los diagramas de Venn pueden usarse para ilustrar ciertas operaciones con
conjuntos. Se dibuja un rectngulo para representar el conjunto universal U. Un
subconjunto A de U se representa por la regin dentro de un crculo dibujado en
el interior del rectngulo, mientras que se representar por el rea del rectngulo fueradel crculo, como se ilustra
en la figura 2.1. En la figura 2.2 se ilustran,
la interseccin y unin, con esta notacin.
Las operaciones de interseccin unin
y
pueden extenderse de manera directa
al acomodar cualquier nmero finito de conjuntos. En el caso de tres conjuntos,
por ejemplo A, B y C, A U B U C tiene la propiedad de queA U ( B U C ) = ( A
U E ) U C, la que obviamente se cumple por si tienen identicos elementos. De
igual forma, vemos que A n B n C = ( A n B ) n C = A n ( B n C).A
continuacin se presentan varias leyes importantes de operaciones de conjuntos
que ya han sido definidas.
Leyesdeidentidad
LeyesdeMorgan:
Leyes asociativas:
A U0 = A
AVU=U
n U =A
= 0
-~
_n_0_
m=nE
A nB = U
A U ( B U C ) = ( A V B) U C
A A ( B ~ c ) = ( A ~ B ) ~ c
(a)
(b)
"
.~
.
"
.~~
~-
un diagramadeVenn.
a) La
CAPTULO 2
38
INTRODUCC16N
A
LA PROBABILIDAD
A U ( B n C ) = ( A U B) n (A U C)
A ~ ( B u c ) = ( A ~ B ) u ( A ~ c )
Leyes distributivas:
{(a, b): a E A y b E B )
Sea r un entero positivo mayor que1, y sean los conjuntos A l , . . . , A,. Entonces
el conjunto del producto cartesiano estdado por
A l X Az
. . . X A,
2-3
Experimentos y espaciosmuestrales
2-3
EXPERIMENTOS
MUESTRALES
Y ESPACIOS
39
considera desde el punto de vista matemhtico como una nocin primitiva y por
ello no se define de otra manera;
sin embargo, podemos notar que los experimentos aleatorios tienen algunas caractersticas comunes. Primero, en tanto que no
podemos predecir un resultado con certeza, s es posible describir elconjunto de
resultados posibles.Segundo, desde un punto de vista conceptual, el experimento
es tal que podra repetirse en condiciones que permanezcan invariables, ocurriendo los resultados una
de manera fortuita; no obstante,
amedida que el nmero
de repeticiones aumenta, surgen ciertos patrones en la frecuencia de ocurrencia
de los resultados.
A menudo consideraremos experimentosidealizados. Por ejemplo, cuando se
arroja una moneda, podemos descartar la posibilidad de
que caiga de canto.Esto
es m8s por conveniencia que por necesidad.El conjunto de resultados posibles se
llama espacio muestral y estos resultados definen al experimento idealizado en
particular. Los smbolos 8 y Y seutilizanpararepresentarelexperimento
aleatorio y el espacio muestral asociado.
De acuerdo con la terminologa empleada en el repaso de conjuntos y sus
operaciones, clasificaremos espacios muestrales (y con ello a los experimentos
aleatorios). Un espacio muestral discretoes aquel en el quehay un nmero finito
de resultados o un nmero finito contable (numerable) deresultados. Del mismo
modo, un espacio muestra1continuo tienen resultados incontables. stospodran
ser nmeros reales en un intervalo o pares reales contenidos en el producto de
intervalos,donde las medicionesse realizan respectoa dos variables en un
experimento.
Para ilustrar experimentos aleatorioscon un espaciomuestral asociado consideremos los ejemplos siguientes:
Ejemplo 2.8
&,:Lanzaruna moneda genuina y observar el lado que cae hacia arriba,
Yp,:(H,T>.
Ejemplo 2.9
e*: Lanzar tres veces una moneda genuina y observar la secuencia de LLca32:
ras y %ruces.
{HHH, HHT, NTH, HTT, THH, THT,
TTH, TTT)
( H = cara, T = cruz)
Ejemplo 2.10
I?,:
33:
CAPTULO 2
40
INTRODUCC16N
A
LA PROBABILIDAD
Ejemplo 2.11
Ejemplo 2.12
Ejemplo 2.13
E6: Sefabrica un tubo de rayoscatdicos y sesometeaunapruebade
Y,:
un minuto.
(O, 1,2, 3, . . .}.
Ejemplo 2.15
g8: Dos soldaduras deamarre
.y8:
Ejemplo 2.16
2-3
164399
41
un da al azar y se observa la
Ejemplo 2.17
Una planta de extrusin produce
una orden de piezasde 20 pies de largo.
Debido a que la operacin de recorte origina desperdicios en ambos
extremos, la barra extruida debe de tener ms de 20 pies. Debido a los
costos involucrados, la cantidad de desperdicios es crtica. La barra se
extruye, recorta y termina y se mide la longitud total de la parte desperdiciada.
3,0:{x: x E R, x > O}.
Ejemplo 2.18
gil: En el lanzamiento de un misil,se
el*:En el ejemplo anterior, las componentes de velocidad se registran continuamente en intervalos de un segundo durante cinco minutos.
Y12: En este caso el espacio se
complica, debido a quetenemos que considerar
todas las realizaciones posibles delas funciones vx(t), y v,(t), y vt(t) para
O S t S 5 minutos.
Todos estos ejemplos tienen las caractersticas necesariaspara ser experimentos aleatorios. Con excepcin del ejemplo 2.19, la descripcin del espacio muestral es directa y, aunque no se considera la repeticin, sera factible repetir los
experimentos. Para ilustrar el fenmeno de la ocurrencia aleatoria, considrese el
ejemplo 2.8. Es evidente que si 8, se repite en forma indefinida, obtenemos una
secuencia de caras y cruces. A medida que continuamos el experimento surgeun
patrn. Ntese que debido a que la moneda es genuina, deberan obtenerse caras
aproximadamente la mitad de las veces. Para poder reconocer la idealizacin del
modelo, simplemente aceptemos un conjunto de resultados tericos posibles, En
8 , se elimin la posibilidad de que la moneda cayera de canto, y en e, donde
registramos el tiempo transcurrido hasta la falla, el espacio muestra1 idealizado
est compuesto por todos los nmeros reales no negativos.
PROBABILIDAD
CAPITULO
LA 2
42
INTRODUCCldN
A
2-4 Eventos
Un evento, por ejemploA , est asociado al espacio muestral del experimento. El
espacio muestral se considera el conjunto universal, de modo que A es simplemente un subconjuntode Y. Obsrvese que tanto 0 como Y son subconjuntos de
Y. Como regla general, se utilizaruna letra mayscula para denotar un evento.
Para un espacio muestral finito,ntese que el conjunto de todos los subconjuntos
es el conjunto
- potencia, y de manera ms general, se requiere que si A C Y,
entonces A C Y ysi A , , A i , . . . esuna secuencia deeventosmutuamente
excluyentes en 3segn se definems adelante, entonces UT= ,A, C Y. Los eventos
siguientes se relacionancon los experimentos C , ,e,,. . . , ClO,que fueron descritos en la seccin precedente. stos se presentan slo como ejemplos, y podran
haberse descritos muchos otros para cada uno de los casos.
F.
.A
I
Figura 2.3
2-5
43
2-5
Definicin
Si un experimento C tiene un espacio muestra Y y un evento A est definido en
Y, entonces P(A) es un nmero real al que se denomina la probabilidad de un
evento A o la probabilidad deA . La funcin P(*)tiene las siguientes propiedades:
l . O < P(A) S 1 para cada evento A de Y.
2. p ( 3 ) = 1
3. Para cualquier nmero finito k de eventos mutuamente excluyentes defi-
nidos en Y.
-"
" "_
I
I
"
"
CAPiTULO 2
44
INTRODUCC16N A LA PROBABILIDAD
Definicin
El valor f, = taA/m se denomina frecuencia relativa del evento A . Tiene las
siguientes propiedades:
1. o SfA6 1 .
2. fA = O si y slo si A nunca ocurre, yfA = 1 si y slo si A ocurre en cada
repeticin.
3 . Si A y B son eventos mutuamente excluyentes, entoncesF A " # =f, -tf8.
2-5
45
i = 1,2, . . . , n
en tanto que
+...+p,,=1
pl + p 2
es
xp, = I
, - I
probables de
CAPITULO 2
46
INTRODUCCldN A LA PROBABILIDAD
=o
otrode
modo
Ejemplo 2.22 Considrese el ejemplo 2.9, donde una moneda se lanza tres
veces, y considrese el eventoA en el que todas las monedas muestran la misma
cara.
Teorema 2-1
Si 0 es el conjunto vaco, entonces P(0) = O.
2-5
47
Teorema 2-2
P(A) =
1 -P(A).
A),
Teorema 2-4
P(A L' B
L
Figura 2.4
"
"
..
___
_"
""
CAPTULO 2
40
INTRODUCC16N
A
LA PROBABILIDAD
Teorema 2-5
k
P(A,
u A , u A , u ... V A , ) =
P ( A , n A,)
P(A,)i=l
r<j=2
P(A,nA,nA,)
1-
i<J'r=3
+ ( - I ) ~ " P ( A , ~ A , ~ .A. ., m
~ ,)
Prueba Refidrase al ejercicio 2-33.
Teorema 2-6
Si A
b)
c)
P(2) = 1 - P ( A ) = .so.
P ( B ) = 1 - P ( B ) = .70.
P(A u B ) = P ( A ) + P(B) = .2
+ .3 = .5.
= 1 -P(A U B )
= 1 - [ P ( A ) P(B)] = .5
Ejemplo 2.25 Supongamos que los eventos A y B no son mutuamente excluyentes y que sabemosP(A) = .20, P(B) = .30, y P(A nB) = .I O. Al evaluar entonces
las mismas probabilidades que antes, obtenemos.
2-6
49
P ( 3 = 1 - P ( A ) = .80.
b) P ( B ) = 1 - P ( B ) = .70.
C)
P(A U B ) = P(A) + P ( B ) - P ( A n B ) = .2 + .3 - . I = .4.
4 p(Ang= .l. e ) P ( A nB ) = P(A u B), = 1 - [P(A) + P(B) - P(A nB ) ] = .6.
a)
CAPITULO 2
50
INTRODUCC16NALAPROBABILIDAD
2-6.1Diagrama
de Brbol
de
multiplicaci6n
2-6
51
. ~ -
.-
CAPITULO 2
52
INTRODUCCI6N
A
LA PROBABILIDAD
a
b
c
d
Si consideramos todas las permutaciones tomadas dos a la vez, stas seran:
ab
bu
ac
ca
ad
da
bc
cb
bd
db
cd
dc
+ 1)
n!
(n - r)!
2-6.4
Corn binaciones
Unacombinacines un arreglodeobjetosdistintos
donde una combinacin
difiere de otra, slo si difiere el contenido del arreglo. En el caso de los cuatro
chips etiquetados a, 6, c y d, las combinaciones de los mismos tomados de dos
en dos son
ab
ac
2-6
53
ad
bc
bd
cd
P;
r! .
(;)
(2-4)
p)
n(n - I)(n
- 2) . . . ' .
(n - r
1)
r!
( a + b),, =
P)dP-I
,=O
t)
= (n
1r )
PROBABILIDAD
CAPTULO
LA 2
54
INTRODUCC16N
A
10!(90)!
. El nmero favorable a A es (
/5\/95\
P(A)
\ O I\ 10)
i 100 \
10
5!
95!
- 0!5! 10!85!
loo!
.58375
10!90!
55
2-6.5 Permutacionesconobjetossimilares
En el caso de que haya k clases distintas de objetos, y los objetos dentro de la
clase no sean distintos, se obtiene el siguiente resultado, siendon , el nmero de
la primera clase, n2 el de la segunda clase, . . . , nk el de la clase ksima, y n,
n2+ . . . + nk=n:
(2- 1O)
Los mtodos de conteo que se presentaron en esta seccin son principalmente
para sustentar la asignacin de la probabilidad donde hay un nmero finito de
resultadosigualmente probables. Es importanterecordarqueestees
un caso
especial.
2-7
Probabilidad condicional
CAPiTULO 2
56
INTRODUCCldN A LAPROBABILIDAD
b)
a)
Figura 2.5
"
m
P(A)
10
Si el primer artculo se reemplaza antes de seleccionar el segundo, la probabilidad condicional P(BIA) = P(B) = 6,y los eventos A y B que resultan de dos
experimentos de selecci6n contenidos en &'se dice que son independientes. Una
definici6n formal de P(AIB) se darti despu6s, y la independencia se estudiar en
detalle. Los siguientes ejemplos ayudarn a desarrollar cierta nocibn intuitiva
para la probabilidad condicional.
Ejemplo 2.29 Recurdese el ejemplo 2.11 enel que se lanzan dosdados, y
sup6ngase que ninguno de los dos est alterado. Se enumera los 36 resultados
posibles. Si consideramos dos eventos
2-7
PROBABILIDAD CONDICIONAL
57
Sea SI:
S2
B1
B2
costa
80
820
900
20
80
1O0
Total
1O0
900
1O00
Hubo un avistamiento.
No hubo avistamiento.
Salidasolitariaen la costa.
Salida solitaria en alta mar.
P(SIIB2)
20
1O0
= -=
0.20
Definicin
Podemos definir la probabilidad condicional del evento A dado el evento B como
(2- 1 1)
56
CAPTULO 2
INTRODUCCIbN
A
PROBABILIDAD
LA
Estadefinicinresulta
de la nocinintuitivaque se present en elanlisis
precedente. La probabilidad condicional
P(.l.)satisface las probabilidades requeridas de las probabilidades. Esto es,
1. o S P(AIB) S 1.
2. P ( 3 J B )= 1.
3. P ( A , u A 2 U A 3 U . . . IB) = P(A,lB) + P(A,IB) + P(A,IB) + . . . , para
A , , A,, A,, . . . , una consecuencia numerable de eventos disjuntos.
4. P(u:= IA,IB) = E:=, P(A,JB)para (Ain A,) = 0 si i f j .
Figura 2.6
Eventos mutuamenteexcluyentes.
2-7
PROBABILIDAD CONDICIONAL
59
Figura 2.7
1
4
Definicin
A y B son independientes si y slo si
P(A
n B ) = P(A) . P(B)
(2-13)
y P(BI.4) = P(B)
(2- 14)
CAPTULO 2
60
lNTRODUCC16N
A
LA PROBABILIDAD
Teorema 2-7
Si A y B son eventos independientes, entonces
1. A y
2.
3.
soneventos independientes.
soneventos independientes.
y B son eventos independientes.
2y
Prueba Parte 1
98
= ,9604
100
Los resultados son obviamente muy cercanos, y una prctica comn es suponer
que los eventos son independientes cuando l a fraccidn de muestreo (tamao de
la muestraltamao de la poblacin) es pequea, digamos menos que . l .
2-7
61
PROBABILIDADCONDICIONAL
Sistema
Figura 2.8
,;
;JzT
-.
El ejemplo 2.32 ilustra la necesidad de generalizar el concepto de independencia para ms de dos eventos. Supngase queel sistema est compuestopor
3 subsistemas o quiz por 20 subsistemas. Qu condiciones se requeriran para
permitir al analista obteneruna estimacin de confiabilidad del sistema obteniendo el producto de las confiabilidades de los subsistemas?
Definicin
LOS k eventos A , , A2, . . . , Al son mutuamente independientes si y slo sila
probabilidad de la interseccin de cualesquiera 2, 3 , . ... , k de estos conjuntoses
el producto de sus probabilidades respectivas.
. . . nA,,)
P ( A , , ) .P ( A , , ) . P ( A , , ) . . . . . P ( A , , )
r
CAPiTULO 2
62
INTRODUCC16N A LA PROBABILIDAD
(2- 15)
Rs = R I R ~. .. Rk
En la definicin anteriordebemos satisfacer 2&- k - 1 condiciones. Considrese tres eventosA, B, y C. stos son independientes siy slo si P(A nB ) = P(A)
. P(B), P(A n c)= P ( A ) . P(C), P(B n C ) = P(B) . P(C), y P ( A n B n c)=
P(A) . P(B) . P(C). El siguiente ejemplo ilustra el caso en el que los eventos son
independientes en parejas pero no mutuamente independientes.
Ejemplo 2.33 Supngase que el espacio muestral, con resultados igualmente
probables, para un experimento particular es como sigue:
o,
El segundo
dgito es uno
Co: El tercer digito es cero.
CI: El tercer digito es uno.
31:
Resulta que
y se ve fcilmente que
P(A, n B,)
= f = P(A,) . P(Bj)
+
= + = P(BJ . P(Cj)
i = o, 1,j = 0,l
P(B, n C,)
i = O, 1 , j = 0,l
O, 1 , j = 0,l
Definicin
Si p ( ~n
, A,) = P ( A , ) . &(A2), se dice entonces que 8, y Z2 son experimentos
independientes.
64
CAPTULO 2
.INTRODUCCldN
A
LA PROBABILIDAD
por lo que
puesto que los eventos(A nBi) son eventos mutuamente excluyentes enparejas.
(VBase la figura 2.9 para k = 4.) No importa que A n Bi = 0 para alguno o la
totalidad de los i puesto que P(0) = O.
Al considerarlosresultadosde
la ecuacin 2-12 podemosestablecerel
siguiente teorema.
Teorema 2-8
Si B,, . . . ,Bk representa una partici6n de Y y A es un evento arbitrario de Y,
entonces la probabilidad total de A est dada por
El resultado del teorema 2-8 es muy til, ya que hay numerosas situaciones
prcticas en las que P(A) no puede calcularse directamente. Sin embargo, con la
informacin de que B, ha ocurrido, es posible evaluar P(A(B,)y determinar as
P(A) cuando se obtienen los valores P(B,).
Otro importante resultado de la ley de probabilidad total se conoce como el
teorema de Bayes.
Teorema 2-9
Si B I ,&, . . . , Bkconstituyen una partici6n del espacio muestra1 Yy A es un evento
arbitrario en Y,entonces para r = 1,2, . . . , k
(1-16)
,=1
Prueba
65
2-9 RESUMEN
Fracci6n lnstalacibn
proveedora
de defectos
Fracci6n
suministrada
por
2
3
.o2
.o1
.15
.80
.O3
.O5
(.15)(.02)
2-9
(.05)(.03)
(.80)(.01)
- 3
"
(.05)(.03)
25
Resumen
CAPTULO 2
66
INTRODUCC16N A LA PROBABILIDAD
2-6 brindan resultados importantes para tratar la probabilidad de eventos especiales. Se defini e ilustr la probabilidad condicional, junto con el concepto de
eventos independientes. AdemBs, consideramos particiones del espacio muestral,
probabilidad total y el teorema de Bayes. Se analizaron los espacios muestrales
finitos con sus propiedades especiales, y serevisaron los mtodos de enumeracin
para utilizarlos en la asignacin de probabilidad a eventosen el caso de resultados
experimentales igualmente probables. Los conceptos que se presentaron en este
captulo constituyen importantes fundamentos para el resto del libro.
2-1 O
2-1
Ejercicios
a)
b)
2%
5
7
3
4
3
1
2.2
2-3
b )& A
C)
2-10
67
EJERCICIOS
2-4
2-5
2-6
2-7
2-8
(a, b,
1lA.
2-9
CAPITULO 2
68
INTRODUCC16N A LA PROBABILIDAD
los artculos son defectuosos. Decide seleccionar una muestra al azar de IO artculos
sin reemplazo yvolveraproducir
el lote si stecontiene uno o msartculos
defectuosos. ,Este procedimiento parece razonable?
2-1 1 Una firma de transporte tienen un Ggntrato para enviar una carga de mercancas de
la ciudad W a la ciudad Z. No hay rutas directas que enlacen W con 2,pero hay seis
carreteras de W a X y cinco de X a Z. Cuntas rutas en total deben considerarse?
2-12 Un estado tienen un milln de vehculos registrados y est considerando emplear
placas de licencia con seis smbolos en los que los primeros tres sean letras y los
ltimos tres, dgitos. $3 ste esquema factible?
2-13 El gerente de una pequeRa planta desea determinar
2-14 Un lotede
2-15 En la inspeccin de lotes demercancas que estn por recibirse, se empleala siguiente
regla de inspeccin en lotes que contienen 300 unidades; se selecciona una muestra
al azar de 10 artculos. Si no hay ms que un artculo defectuoso en la muestra, se
acepta el lote. De otro modo se regresa al vendedor. Si la fraccibn defectuosa en el
lote original esp', determinar la probabilidad de aceptarel lote como una funcin de
P'
mezcla. Cada tubo tienen una vlvula de cinco posiciones que mide el flujo dentro
del tanque. Un da, mientras se experimenta con diferentes mezclas, se obtiene una
soluci6n que emite un gas venenoso, no habindose registrado los valores en las
vlvulas. Cul es la probabilidad de obtener esta misma solucin cuando se experimenta de nuevo de maneraaleatoria?
2-17 Ocho hombres y ocho mujeres con las mismas habilidades solicitan dos empleos.
Debido a que los dos nuevos empleadosdeben trabajar estrechamente, sus perso-nalidades deben ser compatibles. Para lograr esto, el administrador de personal ha
aplicadounaprueba y debe comparar las calificaciones para cada posibilidad.
Cuntas comparaciones debe efectuar el administrador?
2-18 En forma casual, un qumico combin dos sustancias de
laboratorios que produjeron
2-10
EJERCICIOS
69
2-23 Cmo se afecta la probabilidad del sistema si, en el problema anterior, la probabilidad para la operacin exitosa del componente en el ensamble I11 cambia de .99 a .9?
2-24 Considere el ensambleserie-paralelo que se muestraabajo. Los valores Ri (i = I , 2,
3 , 4, 5) son las confiabilidades de los cinco componentes indicados, esto es, Ri=
probabilidad de que la unidad i funcione de manera adecuada. Los componentes
el ensamble falla slo
operan (y fallan) de manera mutuamente independiente y
cuando se rompe
la trayectoria deA a B. Exprese la confiabilidad del ensamble como
una funcin de R I ,R2, R3, R., y Rs.
CAPTULO 2
70
INTRODUCC16N A LA PROBABILIDAD
2-25 Un prisionero poltico ser enviado a Siberia o a los Urales. Las probabilidades
de quelo enven a estos dos lugares son.6 y .4, respectivamente. Se sabe adems
que si un residente de Siberia se elige al azar hay una probabilidad de .5 de que
lleve un abrigo de piel, en tanto que la probabilidad para lo mismos es de .7 en
el caso de un residente de los Urales. AI llegar al exilio, la primera persona que
ve el prisionero no lleva un abrigo de piel. Cul es la probabilidad de que est
en Siberia?
2-26 Se disefia un dispositivo de frenado para evitar que un automvil patine en el que
incluye un sistema electrnico e hidrulico. El sistema completo puede descomponerse en tres subsistemas en serie que operan de manera independiente: un sistema
electrnico, un sistema hidrulico y un accionador mecnico. En un frenado particular, las confiabilidades de estasunidades son aproximadamente .995,.993 y ,994,
respectivamente. Estime la confiabilidad del sistema.
2-27 Dos bolas se extraen de una urna que contiene m bolas numeradas del 1 a m. Se
conserva la primera bolasi tiene el nmero 1, y se regresaen caso contrario. Cul
es la probabilidad de que la segunda bola extrada tenga
el nmero 2?
2-28 Se eligen dos dgitosal azar de los digitos del 1 al 9 y la seleccin es sin reemplazo
Si la suma delos dgitos
(el mismo dgito nopuede escogerse en ambas selecciones).
es par, encuentre laprobabilidad de que ambos dgitossean impares.
2-29 En cierta universidad20 por ciento delos hombre y 1 por ciento delas mujeres miden
ms de dos metros de altura.
Asimismo, 40 por ciento delos estudiantes son mujeres.
Si se selecciona un estudiante al azar y se observa que mide ms de dos metros de
altura, Cul es la probabilidad de que sea mujer?
2-30 Enuncentrodemaquinariahaycuatromquinasautomticasqueproducen
los registrosdeinspeccinanterioresproduce
tornillos.Unanlisisde
siguientes datos:
Mquina
Porcentaje de
produccin
1
2
30
20
35
los
Porcentaje de
defectos producidos
15
2-10 EJERCICIOS
71
c ,
I
\-.~-,I
CAPTULO 2
72
INTRODUCC16N A LA PROBABILIDAD
2-39 Tres imprentas realizan trabajos para la oficina de publicaciones del tecnolbgico de
Georgia. La oficina depublicaciones no negocia una multa contractual por trabajos
atrasados, y los datos siguientes reflejan una gran experiencia con estas imprentas.
Imprenta, i
Fraccin
de
contratos
Fraccin
de
tiempo
de
entrega
con la imprenta i
con mas
de
un mes
de
retraso
.2
.3
.5
.2
.5
.3
Captulo 3
Variables aleatorias
.
unidlmenslonales
I
3-1
Introduccin
Definicin
Si C es un experimento que tiene el espaciomuestral Y, y X es una funcin que
asigna un nmero real X(e) para todo resultado e E Y,entonces X(e) se llama
variable aleatoria.
74
164399
CAPTULO 3 VARIABLESALEATORIASUNIDIMENSIONALES
B
X(e)
b)
a)
a) Y: el espacio muestral
Ejemplo 3.1 Considrese el experimento del lanzamiento de una moneda analizado en los prrafos anteriores. Si X es el nmero de caras que se presentan,
entonces X ( H H H ) = 3, X(HH7') = 2, X(HTH) = 2, X(HT7') = 1, X(THH) = 2,
X(THT') = 1, X(TTH) = 1 , y X(TT7)= O. El espacio del rango R, = (x: x = O, 1 ,
2, 3) en este ejemplo (vase la figura 3.2).
El lector debe recordar que, para todas las funciones y cada elemento en el
dominio, hay exactamente un valor en el rango. En el caso dela variable aleatoria
para todo resultado e E Y corresponde exactamente un valor X(e). Debe notarse
que diferentes valores dee pueden conducir al mismo x, como fue el caso donde
X(TTH) = 1, X(TH7) = 1, y X(HT7') = 1 en el ejemplo anterior.
Cuando el resultado en Y es ya la caracterstica numrica deseada, entonces
X(e) = e, la funcin identidad. El ejemplo2.13 en el cual un tubo de rayos
catdicos operaba hasta fallar, es un buen ejemplo. Recurdese que Y = {l:
t2
O}. Si X e s el tiempo previo a la falla, entoncesX ( t ) = t . Algunos autores llaman
a este tipo de espacio
muestral fenmeno de valores numkricos.
El espacio del rango R,, est integrado por los valores posibles de X,y en un
X
Figura 3.2.
3-1 INTRODUCCldN
I
Figura 3.3.
..
75
Eventosequivalentes.
Definicin
Si Y es el espacio muestra de un experimento B y una variable aleatoria X con
espacio del rango Rx se define en Y, y adems si el evento A es un evento en Y y
B es un evento en Rx, entonces A y B son eventos equivalentes si
Px(B)= P ( A )
donde A
{ e 9:
X(e) E B }
CAPTULO 3 ALEATORIAS
VARIABLES
76
UNlDlMENSlONALES
Definicin
Si A es un evento en el espacio muestral yB es un evento en el espacio del rango
Rx de la variable aleatoriaX,definimos entonces la probabilidad de B como
A
{ e E Y :x ( e ) E B }
x"(B) =
(e
.Y':
X(e)
B},
de manera que
P*( B ) = P ( X " ( B ) )
Los siguientesejemplos
P(A)
3-2
LA FUNC16N DE DlSTRlBUCl6N
77
rango, y el inters por este ltimo ms que por el espacio muestral es evidente,
puesto que los resultados numricos son de inters.
Ejemplo 3.2 ConsidCreseel lanzamiento de dos dados no alteradoscomo se
describi en el ejemplo 2.1 1. (El espacio muestral se describi en el captulo 2.)
Supngase que definimosuna variable aleatoria Y como la suma de los nmeros
que caen al lanzar los dados. Por tanto, RY = (2, 3,4, 5,6, 7, S, 9, 10, 1 1, 12) y
las probabilidades son f.f.$ f.$.^.^,^.^.^,^.^ respectivamente. La tabla 3-1 muestra eventos equivalentes. El lector recordar que hay 36 resultados, los cuales,
puesto que los dados no estn alterados, son igualmente probables.
Ejemplo 3.3 Un ciento de marcapasos de corazn se ponen a prueba de durabilidad en una solucin salina a una temperatura lo m8s cercana posible a la del
cuerpo humano.La prueba es funcional, con la salida del marcapaso monitoreada
con un sistema queproporciona salida dela seilalde conversin a la forma digital
para realizar una comparacin contra un patrn de disefio. La prueba se inici el
primero de julio de 1987. Cuando la salida del marcapasos varia respecto del
patrn de I O por ciento, ello se considera una falla y la computadora registra la
fecha y la hora del da (d, 1). Si X es la variable aleatoria "tiempo antes de la falla'', entonces Y = ( ( d .t): d = fecha, t = tiempo} y Rx = {x: X 2 O}. La variable
aleatoria X es el nmero total de unidades de tiempo transcurrido desde que el
mdulosesometia
prueba. Trabajaremos directamente con X y su ley de
probabilidad. Este concepto se analizar en las siguientes secciones.
3-2
La funcin de distribucin
Como convencin utilizaremos una letra minscula de la misma letra para denotar un valor particular de una variable aleatoria. De tal modo (X = x), (X , x),
( X S x ) son eventos en el espacio del rango de la variable aleatoria X , donde x es
un nmero real. La probabilidad del evento (X S x ) puede expresarsecomo
funcin de x en la forma
F,(x) =
&(X
5 x)
(3-1)
i,
ra
"
F,(X)
-f
-
-;
-;
-
x <
O < X < l
lrx<2
2 1 X < 3
=1
x 2 3
Una representacidn grfica se muestra en la figura 3.4.
Ejemplo 3.5 Recuerdese otra vez el ejemplo 2.13, cuando un tubo de rayos
catdicos se pone a funcionar hasta fallar. Ahora
Y = ( t : t S O), y si dejamos que
Xrepresente el tiempotranscurrido en horas hasta la falla, entonces el evento ( X
S x) est en el espacio del rango de X.Un modelo matemtico que asigna la
probabilidad a (XS x) es
F,(X) =
X I 0
= 1 - e-hx
x > o,
donde A es un nmero positivo llamado la tasa de falla (falladhoras).El empleo
el tiempoprevioala
3-2
LA FUNC16N DE DISTRIBUC16N
79
o S F,(x)
-zc<x<=
2. lmx+ F,(x) = I
Imx+" Fx(x) = 0
3. La funcin es no decreciente. Esto es, si x, S X,, entonces
F Y(X,)
F., Vd.
4. La funcin es continua desde la derecha. Esto es para todo x y 6 > O,
m
A l revisar los ltimos tres ejemplos, notamos que en el ejemplo 3.4, los valores
de x para los cuales hay un aumento en F, (x) son enteros, y donde x no es u n
entero, entonces F, (x) tiene el valor que tuvo en el entero ms cercano x a la
izquierda. En este caso, Fx (x) tiene un suffoen los valores O, I , 2 y 3, y contina
Figura 3.6
80
CAPITULO 3 UNIDIMENSIONALES
ALEATORIAS
VARIABLES
ALEATORIAS
3-3 VARIABLES
81
Definicin
Si Xesuna variable aleatoria discreta, asociamos
un nmeropx(x,) = Px(X= xi)
con cada resultado xi, en Rxpara i = 1,2, . . . ,n, . . . , donde los nmerospx(xi)
satisfacen
1. p X ( x i )2 O
C:,,p,(x;)
2.
paratodo i
1
Y
F x ( 4 = px(x5 x;> =
cPxb)
(3-4)
X<X,
= (:)px0
=o
-A"-"
x = O,l,
otro
de
modo
Presentaci6n
tabular
Presentacidn
118
318
P(X)
"_I__
(3-5)
grdfica
318
118
Figura 3.7
moneda.
..., n
'l81
118
'l81 118
2
I
3
Distribucidndeprobabilidadparaelexperimentodellanzamientodeuna
"
".
CAPiTULO 3 ALEATORIAS
VARIABLES
82
UNIDIMENSIONALES
modo
=o
otro
de
(3-6)
= o modootro de
Si se deseara la presentacin ya sea en forma tabular o grfica, sera como se
muestra en la figura 3.8; sin embargo, a menos que haya alguna razn especial
para usar estas formas, usaremos la relacin matemtica.
Ejemplo 3.12 En el ejemplo 3.8, donde el contadorGeigersepreparpara
detectar elconteo de la radiacin defondo, podramos emplear la siguiente
relacin que experimentalmente ha demostrado ser apropiada:
px(x) = e-(Xt)/x!
modo
=o
otro
x = 0 , 1 , 2 ....
de
X >O
(3-7)
3-3 VARIABLESALEATORIASDISCRETAS
(:)(:)/y)
(:)r,)/('?)
Presentaci6n
tabular
0.805
1 0.014
(:)(':)/(',"")
(i)(F)/(?)
0.003
'O.Oo0
0.805
Presentaci6n grafica
O. 178
Lx
0.003
3
4
Figura 3.8 Algunas probabilidades hipergeornbtricas N = 100, D = 5. n = 4.
O
CAPITULO 3 ALEATORIAS
VARIABLES
04
UNIDIMENSIONALES
P,(X
x ) = lm [ F ( X
6+0
+ 8 ) - ~ ( x ) =] O
(3-9)
(3-10)
y resulta que
(3-11)
Notamos tambiCn la cercana correspondencia en esta forma con la ecuaci6n
3-4, reemplazandouna integral al smbolodela sumatoria, y las siguientes
propiedades de&(x):
1. &(x) 2
2.
J fx(x)dx
para toda x E Rx
= 1
R.
85
3-4 VARIABLESALEATORIASCONTINUAS
X J
P { e E Y:
a
X(e) S b }
/ = f f x ( x )dx
6
(3-12)
he-
=o
t 2O
modo
otro
de
donde il> O es una constante conocida como la tasa de falla. Esta funci6n de
densidad de probabilidad se llama la densidad exponencial, y la evidencia experimental ha indicado que esapropiada para describir el tiempo previo laa falla
CAPITULO 3 ALEATORIAS
UNIDIMENSIONALES
VARIABLES
86
- e-lOOh
J99
M>
.
Ejemplo 3.14. Una variable aleatoriaxtiene la funcin de densidad de probabilidad dada a continuacin, mostrada grficamenteen la figura 3.1 1.
=x
01x<1
=2-x
1 1 x < 2
=o
de otro modo
a)
o+i
+(2x -
3/2
-+++;
-
Px( X I 3) = 1
d ) Px( X 2 2.5) = O
e ) P,(: < X < +) = j;,,xdx
a7
c)
= X + + =+%j;l2(2
- x ) dx
Figura 3.12
Cx,P*(x,>
para X discreta
/_I xf,
( x ) dx
para X continua
(3-13 )
Figura 3.13.
CBlculo de la media
fxb)
0 1 x 5 1
=2-x
1 1 x 1 2
=o
de otro modo
+ p
03
x.Odx+JZ~x.Odx=l
3-5
89
(x -
~ ) ~ f ~dx( x )paraxcontinua
(3-14)
1
1
+(2 - 1y. - + ( 3 - q 2 . - = 2
5
5
que es cuatro veces mhs grande que la varianza de la variable aleatoria que se
muestra en la figura3 . 1 4 ~ .
Si las unidades en la variable aleatoria son pies, por ejemplo, entonces las
unidades de la media son las mismas, pero las unidades de la varianza seran pies
cuadrados. Otra medida de dispersin, llamada la desviacin estndar, se define
como la raz cuadrada positiva de la varianza y se denota por medio deo,donde
a = @
(3-1 5 )
Se observa que la unidad de o son las mismas que las de la variable aleatoria, y
un valor pequeAo de o indica poca dispersin, en tanto que un valor grande seilala
una dispersin mhs grande.
Una forma alternativa de la ecuacin 3-14 se obtiene mediante manipulacin
algebraica como
90
a 2=
CX12PX(Xf> -
P2
para X discreta
.l
m
c4
x 2 f x ( x ) dx
para X continua
p2
(3-16)
Ejemplo 3.17
a)
+[I-;)
"+
(3 " -
.-
;I2.;
8
AI emplear la forma alternativa
.a
lo que se simplifica a
a 2 = n p ( ~-
c)
p)
=o
x 2 0
de otro modo
+ del ejemplo
91
Entonces
d)
donde
gx(x)
En consecuencia
p
x 20
=o
de otro modo
ix.x-
1 6 ~ e - ~ d=x -
Ntese que la media es la misma para las densidades en las partes c) y d),
teniendo c) una varianza dos veces mayor que6).
En el desarrollo dela media y la varianza, utilizamos la terminologa media
de In variable aleatoria y varianza de la variable aleatoria. Algunos autores
92
FL; =
CxPx(x,)
para X discreta
ta
/ - _ x k f x ( x ) dx
0,1,2, ...
paraxcontinua
(3-17)
Pk donde
ph
c ( x-~~ ) k ~ p X ( x ~ )
para X discreta
( x - p ) f x ( x ) dx
0,1,2,...
paraxcontinua
(3-18)
(3-19)
3-6
Desigualdad deChebyshev
En secciones previas de este captulo, se seal que una varianza pequea, 02,
indicaquesonimprobablesgrandesdesviaciones
respecto a la media, p . La
desigualdad de Chebyshev nos brinda un medio para entender cmo la varianza
mide la variabilidad alrededor de p .
3-6
93
DESIGUALDAD DE C H E B Y S H N
Teorema 2-1
SeaXuna variable aleatoria (discretay continua), y sea k algn nmeropositivo.
Entonces
(x
- p) fx( x ) dx = /&(x
-m
Puesto que
- p) - f x ( x ) dx
r+fi(
x - p)2 * fx( x ) dx 2 O
P - 6
resulta que
a;por tanto,
(3-21)
CAPITULO 3 VARIABLESALEATORIASUNIDIMENSIONALES
94
O
1
es a menudo til.
La utilidad de la desigualdad Chebyshev parte del hecho de que se requiere
un conocimiento mnimo de la distribucin de X.Slo deben conocerse p y o z.
Sin embargo, Ladesigualdad de Chebyshev es un enunciado dbil,lo que esten
detrimento desu utilidad. Si seconoce la forma precisa defx(x) o px(x), entonces
puede efectuarse un enunciado ms poderoso.
Ejemplo 3.18 A partir del anlisis de los registros de una compaa, un gerente
de control de materialesestima que la media y la desviacin estndar del tiempo de entrega que se requiere al comprar una pequea vlvula son de 8 y 1.5
das, respectivamente. El no conoce la distribucin del tiempo de entrega, pero
est dispuesto a suponer
que las estimaciones de la media y ladesviacin estndar
son del todo correctas. Al gerente le gustara determinar un intervalo de tiempo
tal que la probabilidad deque se reciba durante ese tiempo sea al menos de $.Esto
es,
I=-
k2
3-7
Resumen
3-8
EJERCICIOS
3-8
95
Ejercicios
3- 1
3-2
3-3
Una variable aleatoriaX tienela funcidn de densidad deprobabilidad ce-r. Encuentre las variables apropiadas de c, suponiendo O X < m. Encuentre la media y la
varianza de la funcibn de
densidad de probabilidad de X.
3-4
3-5
Considere las tres funciones dadas a continuacin. Determine cules funciones son
de distribucin (FDC).
A,
a ) [,.(x)
h ) G,,.(x)
c)
= 1-
O < x < 00
o<x<O0
e"
= e"
=o
x<o
H , y ( x ) = e'
- O 0 < X l O
x>o
=1
3-6
p,.(x)
x=o
x=l
"
3
=O
=o
de
otro
modo
de otro modo
3-8
3-9
CAPITULO 3 ALEATORIAS
VARIABLES
96
UNIDIMENSIONALES
=o
de otro modo
Encuentrelaprobabilidaddequelequedentrajessinvender
temporada.
al finaldela
F,(x)
1-
if)
Y+l
=o
0 , 1 , 2 , ...
x<o
U)
fx(x)
kx
0 1 x < 2
= k ( 42-5xx) 1 4
=o
modo
otro de
densidad de probabilidad.
U) Encuentre el valor de k para el cualfes una funcibn de
6) Encuentre la media y la varianza de X.
c) Encuentre la funcibn de distribucibn acumulativa.
3-12 Repita el problemaanterior considerando que la funcibn densidad
de
de probabilidad
= kx
fx(x)
k(2a
=o
3-13
G<x<u
-
x)
modootro
a I x I 2a
de
U) El valor apropiado de k.
b ) La media y la varianza de T.
C ) Encuentre la funcibn de distribucibn acumulativa.
3-8
EJERCICIOS
97
px(x)
k(1/2)
=o
a)
px (x). donde
x = 1,2,3
otro de
modo
Determine k.
. . .) tiene
probabilidades deocurrencia de
A
6
$1O00
$1050
$11O0
$1 150
$1200
$1350
.2
.3
.1
.1
.3
.3
.3
.O5
.O5
.1
.1
.I
b)
c)
3-19 Demuestre que la funcidn de probabilidad para la suma de los valores obtenidos al
98
=o
otro
de
modo
Desarrolle la FDC para X.
b ) Determine la media de la varianza de X.
c) Encuentre pi.
d) Determine el valor m tal que Px (X2 m) = P(X M).
a)
3-22
w]
P[lX - 3 k
como una funcin de k (para k > O). En el mismo sistema de
ejes, grafique la probabilidad determinada por la desigualdad de Chebyshev.
3-23 Encuentre la funcin de distribucin acumulativa asociada a
=o
otro
de
modo
ni2. Cul
3-26 Demuestre que los momentos centrales pueden expresarse en trminos de los momentos del origen mediante la ecuacin 3-19. Sugerencia: Vase el captulo 3 de
Kendall y Stuart (1963).
Captulo 4
Funciones de una variable
aleatoria y esperanza
4-1
Introduccin
Los ingenieros y los cientficos de la administracin con frecuencia estn interesados en el comportamiento de alguna funcin, por ejemplo H, de una variable
aleatoria. Supngasepor ejemplo, un caso en que el rea de la seccin
transversal
circular de un alambre de cobre esel punto de inters. La relacin Y = nX2/4,
donde X es el dimetro, brinda el rea dela seccin transversal. Puesto que X es
una variable aleatoria, Y tambin es una variable aleatoria, y esperaramos ser
capaces de determinar la distribucin de probabilidad de Y = H(X) si se conoce
la distribucin de X . La primera parte de este captulo tratar con problemas de
este tipo. Esto resulta del concepto de esperanza, una nocin empleada extensamente a lo largo del resto delos captulos de estelibro. Se desarrollan aproximaciones para la media y la varianza de funciones de variables aleatorias, y se
presenta la funcin generatriz de momentos, un artificio matemtico para producir momentos y describir distribuciones, con algunos ejemplos.
4-2
Eventosequivalentes
1O0
Figura 4.1
define de manera quelos valores y = H(x) en RY,el espacio del rango de Y, sean
reales, entonces Y es una variable aleatoria, puesto que para todo resultado e E
3, se determina un valor y de la variable aleatoria Y; esto es, y = H[X(e)].Esta
nocin se ilustra en la figura 4.1.
Si C es un evento asociado a Ry, el espacio del rango de Y, y B es un evento
en R,, entonces B y C son eventos equivalentes si ellos ocurren juntos; es decir,
si B = ( x E Rx:H(x) E C). Ademds, s i A es un evento asociadocon Y y, tambin,
A y b son equivalentes, entoncesA y C son eventos equivalentes.
Definicin
Si X e s una variable aleatoria (definidaen Y) que tiene espacio del rango Rx,y si
H es una funci6n de valoresreales, de modo que Y = H ( X ) es una variable aleatoria con espacio del rango R y , definimos entonces para cualquier evento
c c Ry
P y ( C ) = P x ( { x E R,: H ( x )
C})
(4-1)
Y: H [ X ( e ) ] E C } )
Sin embargo, la ecuacin 4-1 indica el mtodo que se usar en la solucin del
problema. Encontramos queel evento B en Rx es equivalente a C en Ry; despus
determinamos la probabilidad del eventoB .
Ejemplo 4.1 En el caso del Area de la seccin transversal Y deun alambre,
supngase que conocemos que el didmetro tiene la funcin de densidad:
f,( x )
200
=o
1.000 I
X S 1.O05
de otro modo
4-3
FUNCIONESVARIABLE
ALEATORIA
DEDISCRETA
UNA
101
a)).
a}
=
=
200(JTm - 1)
.9975
Ejemplo 4.2 En el caso del experimentodel contador Geiger del ejemplo 3.12,
empleamos la distribucih dada en la ecuacin 3-7:
x = O, 1 , 2 , . .
p x ( x ) = e-"(At)X/x!
=o
de otro modo
P,(Y
donde
Y=2X+2
PX(2X+ 2 2 5 )
[ p X ( 0 )+ p , ( 1 ) ]
e-"[1
i :i
P* X I -
+ (At)]
4-3
Supngase que tanto X como Y son las variables aleatorias discretas, y dejemos
que x , ~x,,
, . . . ,xlk,. . . ,representen los valores de X de modo que H(x5 )= yi para
algn conjunto de valores indices, C! = { j :j = 1,2, . . . ,S , } .
La distribucin de probabilidad para Y se denota por medio dep y ( yi)y esta
dada por
CAPTULO 4
102
para j = 1, 2,3,4
Figura 4.2
Probabilidades en Ry.
PYbJ
PY(Y =y,>=
PAX,,)
(4-2)
/t
zP
Ejemplo 4.3 En el experimento del lanzamiento de la moneda donde X represent el nmero de caras, recurdese que X tiene cuatro valores, O, 1 , 2, 3, con
probabilidades d, i,i,$.Si Y = 2X - I , entonces los valores posibles de Y son -1,
1, 3 , 5, y pv (-1) = ;, p v (1) O S, py(3) = ;i, p v (5) = En este caso, H es tal que
para caday hay exactamente una x.
a.
Figura 4.3
Ejemplo de funcin H.
4-3
FUNCIONESVARIABLE
ALEATORIA
DE UNA
DISCRETA
103
=
P
8A
A
Ejemplo 4.5 Supngase que X tiene una funcin de densidad dada por
& ( x ) = Xe-
=o
x L
otro
de
Adems, si
Y=O
= I
p a r a x S 1IA
p a r a x > IIA
entonces
."
- " ~ . -
"
"
o
modo
CAP~TULO4
104
l . Obtener FyCy) = P y ( Y
y) determinando el evento B en Rx,quees
equivalente al evento ( Y y ) en Ry.
2. Diferenciar F y @ ) con respecto a y para obtenerfy@).
3. Encontrar el espacio del rango de la nueva variable aleatoria.
o I x I4
& ( x ) = x/8
=o
otro
modo
de
a)
F,(y)
P,(Y 5 y ) = P,(2X
X I
( y - 8)/2)
+ 8 5y)
= PX(
(x/8) dx
= r x 2
2 (~-8)/2
16
-(y2
64
16y
+ 64)
H ( x ) = 2x + 8
o
4
Figura 4.4
La funcidn H ( x ) = 2x + 8 .
= H-
(y)
( y - 8)/2
4.4
Figura 4.5
105
=o
de otro modo
CAPTULO 4
106
=o
otro
de
modo
6).
Teorema 4-1
Si X es una variable aleatoria continuacon funcin de densidad de probabilidad
fx que satisfacef.&) > O para a < x < b, y y = H(X) es una funcin de x continua
estrictamente crecienteo estrictamente decreciente, entonces la variable aleatoria
Y = H(X) tiene la funcin de densidad
con x = H"(y) expresada en trminos dey. Si H est creciendo& (y) > O si H(u)
< y < H(b); y si H esta disminuyendo,fy (y) > O si H(b) < y < H(a).
Prueba (Considerando slo H creciente. Un argumento similar se cumple para
H decreciente.)
FAY)=PAY 2Y )
Px(H(X)2Y>
dF,(x)
fAY)= F A Y )
dx
7
. -,
4
porlaregla
f,(x)
x/8
=o
Ix I
4
otro
de
modo
de la cadena
4-5
ESPERANZA
y H(x) = 2x
107
ecuacin 4-4,
fu( y )
=o
4-5
otro
de
(~1'32)
Iy I
16
modo
Esperanza
E(EI(X)) =
H .( px x, )( x , )
paraxdiscreta
(4-5)
paraxcontinua
(4-6)
todo i
E( H( X ) )
JruH ( x ) . f x ( x ) dx
-m
E ( H ( x))= E ( x) = p
(4-7)
E( H( X ) )
E ( ( X - p)')
U'
(4-8)
CAPiTULO 4
108
v( x ) = E ( ( x - E ( X ) ) )
=
E(X2)
[E(X)I2
(4-1 O )
E(X
(4-1 1)
k )
Y
llk =
E((X-E . W k )
Haydosfuncionesespeciales,
H, quedebenconsiderarse en estepunto.
Primero, supngase queH ( x ) = aX, donde a es una constante. De modo que para
X discreta
E(QX) =
x f x ( x ) dx = aE( X )
(4-13)
-m
V ( a X ) = E ( [ax- a ( X ) ] )
En el caso en el que H ( x )
inmediato que
= a,
a2V( X )
(4-14)
E(a)=a
(4-1 5 )
V ( a )= o
(4-16)
Ejemplo 4.9 Supngase que un contratista participa en un concurso para efectuar un trabajo que requiere para terminarse X das, donde X es una variable
aleatoria que denota el nmero de das para terminar el trabajo. Su ventaja, P ,
depende deX, esto es, P = H(x). La distribucidnde probabilidad, de X,(x, p ( x ) ) ,
es como sigue:
4-5
ESPERANZA
3
4
5
en otro caso
1
8
2
1
5
E(X)=3.-+4.-+5.-=-8
8
8
33
8
Y
2
7)
LJ
64
Si la funcin H(X) esta dada como:
X
H(x)
3
4
$10,000
- 7,000
2,500
i:i + (3- ( 3
10,000
2500 -
7000 -
$1062.50
y el contratista vera esto como una ventaja promedio que obtendra si el contratista concursara muchas veces (en realidad un nmero infinito de veces), donde
H permanece igual y la variable aleatoria se comportade acuerdo con la funcin
de probabilidadp x . La varianza deP = H(x> puede calcularserbpidamente como
b(/f(
x))=
1
(10,000)* . 8
+ ( 2 5 0 0 ) 2 . --x + (-7000)l .
(1062.5)2
= $27.53 . 10
110
Nmero de clientes, x
23
24
25
Probabilidad, p d x )
.O1
.O4
26
28
27
29
30
si X >
.15(s - X )
si X I
L ( X , s ) = .1O(X=
E ( L ( X , s ) )=
. 1 5 ( ~- X ) .px(.)
I=
23
+ 1
. ~ O ( X-.Y) .px(.)
x=s+l
E(L(X,26))
.15[(26 - 23)(.01)
$.1915
.15[(27 - 23)(.01)
Para S = 27:
E(L(X,27))
$.1440
.15[(28 - 23)(.01)
Para S = 28:
E(L(X,28))
$.1790
4-6
APROXIMACIONES A (/-/(X))
Y V(H(X))
Ejemplo 4.1 I
diagrama.
111
AI menos una de las unidades debe funcionar, la redundancia est en espera (lo
fx(.)
h2xe
=o
x >
o, x > o
dc otro modo
= /%x
. X2xe
x-x
dx
= -
4-6 Aproximaciones a E ( H ( X ) )y V ( H ( X ) )
En casos en los que H(X) es muy complicada, puede resultar dificil la evaluacin
de la esperanza y de la varianza. A menudo, puede obtenerse una aproximacin
a E(H(X))y V(H(X)) utilizando u n desarrollo de la serie de Taylor. Para estimar
la media, se expande la funcin H hasta dos trminos de una serie de Taylor,
donde la expansin es alrededor de x = p. Si Y = H(X), entonces
CAPITULO 4
112
(4-17)
H(p)
+ ( X - p ) . H ( p ) + Rl
donde
[ H ( p ) I 2 .u 2
(4-18)
fx(x)
~OOOX-~.
=o
X 2
10
modo
otro de
entonces
E ( T ) = l C c 2 ( 1- . 0 0 5 ~ ) . ~3 0 0 0 dx
~ ~
10
Y
V ( T ) = i m 4 ( 1 - . O O ~ X ) . ~. ~ O O O X -dx
~ - (E(T))2
10
4-6
113
y.,
1;
(1 - .005x).
dx
x4
(1 - . O O ~ X ) ~ . ~
dx
x4
~ O O O X - ~=
~ X- 1 5 0 0 ~ - ~
Y
u2 = V ( X )
E ( X 2 ) - [ E ( X ) ] = Jmx . ~ O O O X -dx
~
152 = 75(C)2
10
Puesto que
H( X)
2(1 - .005X).2
por tanto
H(X )
- .012(1 - .005X)02
Y
H(X)
.000012(1 - .005x)-O.*
por lo que
2[1 - .005(15)].
H(15) 2: - .O12
H(15)
1.82
Y
H(15) = O
Al emplear las ecuaciones 4-17 y 4-1 8
E(T)
1
H(15) + - H ( p ) . U
2
1.82
Y
V ( T ) 2: [H(15)I2. u 2 = [ - .01212 . 75
.O81
Un planteamiento alternativo a este tipo de aproximaciones utiliza la simulacin digital y los mCtodos estadisticos para estimarE(Y) y V(Y). La esencia de
este ltimo planteamiento esproducir n reconocimientos de la variable X , donde
CAPiTULO 4
114
F,,'(u,)
1 , 2) . . . )n
(4-19)
fJ u )
oIu
de otro modo
5 1
(4-20)
4-7
Definicin
Dada una variable aleatoria X,la funcin generatriz de momentos Mdt) de su
distribucin de probabilidad es el valor esperado de e',. Expresado en forma
matemtica
M,(t)
E(erX)
(4-21)
e'lTp,( x,)
Xdiscreta
(4-22)
Xcontinua
(4-23)
todo i
[me'.yfx(x)
00
dx
4-7
115
r2
M,(t)
+ E ( x ) r. + E ( x 2 ) .2 + - . . + E ( x ' ) .
~ [ e '=~1 ]
t'
-
r!
por lo que
t2
r'
M,(r)=l+~;.r+lL;.-+...+lL:.r!+...
2!
(4-24)
De tal manera, vemos que cuandoMx (I) se escribe como una serie de potencias
en t, el coeficiente de flr! en la expansi6n es el momento rtsimo alrededor del
origen. Un procedimiento, en consecuencia,para utilizar la funci6n generatriz de
momentos sera
d'
-dtM x ( r ) ~
E I X ' e ' X ] r = o= p ;
(4-25)
r=o
suponiendo que podemos intercambiar las operaciones de diferenciacibn y esperanza. Por consiguiente, un segundo procedimientopara utilizar la funci6n generatriz de momentos consiste en
l . Determinar Mdr) en forma analtica para la distribuci6n particular.
2. Hallar , d r
ir
M, (t)
,=o
116
CAPITULO
4 FUNCIONES DE UNA VARIABLE ALEATORIA Y ESPERANZA
(;jp"(l - p ) " -
x = 0,1,2, . . . , n
=o
otro
de
modo
donde O < p < 1 y n es un entero positivo. La funcin generatriz de momento
Mdt) es
I1
M , ( [ )=
e'x(:)p'(l
.I =
- p)l~-z
x=O
As, esta ltima sumatoria se reconoce como el desarrollo del binomio de [ pe'
(1
+ p)]",por lo que
M , ( ? )= [ p e r
+ (1 - p ) ] "
4-8
117
RESUMEN
- p).
=o
otro
de
modo
r ( b ) (como se mostrara en el
(1 -
;)-b
encontramos
M,(t) = 1
+ b-a +
2!
4-8
b
=
P'z =
b ( b + 1)
a2
Resumen
118
Y ESPERANZA
Sepresent el operadordelvaloresperado
en trminosgeneralespara
E[H(X)],y se demostr que E(X) = ,u, la media, y E(X - ,u)2 = cr2, la varianza.
El operadordela
varianza V se defini como V(X) =
- [E(X)]*.Se
desarrolla- ron aproximaciones para E(H(X)) y V(H(X))que son tiles cuandolos
mtodos exactos presentan dificultades.
Sehapresentadoeilustradola
funcin generatrizde momentos para los
momentos ,u'de una distribucin de probabilidad. Se observ que E(X ') = ,u',,
E(a2
4-9
4- 1
Ejercicios
Un robot posiciona diezunidades en un torno para maquinado cuando se gradael
torno. Si el robot no tiene launidad posicionada de maneraapropiada, sta cae, y la
posicin del torno permanece abierta, resultando de ese modo un ciclo que produce
menos de diezunidades. Un estudio del funcionamiento pasado
del robot indica que
si X = nmero de posiciones abiertas,
X =0
p x ( x > = 0.6
x=I
=0.3
x =2
= 0.1
de otro modo
= 0.0
Si la prdida debida a posiciones vacas est dada por Y = 20X2,
a) Encuentreph).
6) Encuentre E( Y)y V( Y).
4-2
=o
otro
de
modo
dada por la
+ 2X.
=o
a)
otrode
modo
4-9
EJERCICIOS
6)
4-4
119
Un contratista ofrece realizar un proyecto, y los das, X,requeridos para la terminacin siguen la distribucih de probabilidad dada como:
ps(x)
0.1
0.3
0.4
= 0.1
= 0.1
=O
La utilidad del contratista es Y = 2000( 12 -,Y).
a) Encuentre la distribucin de probabilidad
b ) Determine E ( m , V ( 3 , E( Y) y V( Y).
10
x =
de Y.
f x ( x)
2xe- x z
=o
x 2
de otro modo
11
12
x = 13
x = 14
de
otro
modo
4-5
= X2.
pD,(d) =
=
a)
6)
lo
d = 0 , 1 , 2 , 3,..., 9
de
otro
modo
4-7
4-8
=o
de otro modo
CAPTULO 4
120
FUNCIONES DE UNA
VARIABLE
ALEATORIA
Y ESPERANZA
4-9
=O
a)
b)
c)
otro
de
2X *
modo
4-10 Una antena rotatoria de dos lados recibe sefales. La posicin rotacional (ngulo) de
=o
otro
modo
de
La setla1 puede recibirse siY >yo, donde Y = tan X.Por ejemplo, yo = 1 corresponde
n
n 5n
3n
a - < X < - y 7 < X < - Encuentre la funcin densidad paraY.
4
X , con densidad
fx(x)
1 0 6 I x I2
10-6
=o
x 106
modo
otro
de
relacin
A
(3
+ .05G)
=o
otro
de
modo
quese obtuvieron eneste
4-9
121
EJERCICIOS
f x ( x1 ) 1= xl 5 2
=
deotromodo
x .
deotromodo
e".
x 2 O
=o
otro
de
modo
H(x)
(1
+ x)'
a)
b)
= u x ' e ~'x'
x >
=o
de otro modo
Evale la constante u.
Suponga que unanuevafuncin Y = 18X2 es de inters. Encuentre un valor
aproximado para E( Y) y para V( Y).
=o
y >O
otro
modo
de
CAPTULO 4
122
x >
=o
de otro modo
Determine la funcin generatriz de momentos para X y emplee esta funcin para
evaluar E ( X ) y V(X).
4-20
4-21
4-22
=o
x)< IxJ
otro
5 x 5
de
1, u >
o,
h>
modo
Evalelaconstante k.
b ) Determine la media.
c ) Encuentre lavarianza.
a)
4-23
a)
h)
4-24
x =
1/4
x =1
l/x
h =
1/x
.x
o
de otro modo
Determinelamedia y la varianzade X a partir delafuncingeneratriz
momentos.
Si Y = (X- 2), encuentre la FL)C para Y.
dc
4-9
EJERCICIOS
123
p3 = E(
Demuestre que p 3
simdtrica y3 = O.
= $3 - 3p2 p1
pi)?
+ 2(p1)3. Demuestre
que r.
4-26 Un conjunto de constante k,, denominadas acumulantes, puede emplearse en lugar
Captulo 5
Distribuciones de probabilidad
conjunta
5-1 Introduccin
En muchas situaciones debemos tratar con dos o ms variables aleatorias en forma
simultnea. Por ejemplo, podramos seleccionar muestras de hojas deacero
fabricadas y medir la resistencia al corte y el dimetro de soldaduras de puntos
soldados. De tal modo, que tanto la resistencia al corte de la soldadura como el
dimetro de la misma son variables aleatorias de inters.
El objetivo de este capitulo es formular distribuciones de probabilidad conjuntas para dos o ms variables aleatorias y presentar los metodos para obtener
distribucionestanto marginales como condicionales. Se define la esperanza
condicional, as como
la regresin de la media.
Presentamos tambien definiciones
de independencia de variables aleatorias, covarianza y correlacin. Se presentan
adems funciones de doso ms variables aleatorias, y seincluye un caso especial
de combinaciones lineales con su correspondiente funcin generatriz demomentos. Por ltimo, se presenta la ley de los grandes nmeros.
Definicin
Si 3 es el espacio muestra1 asociado a un experimento C, y X , , X,, . . . ,X , son
funciones, cada una de la cuales asigna un nmero real, X,(e), X,(e),. . . ,&(e),
a cada resultado e, designaremos a [ X , ,X,, . . . ,X , ] vector aleatorio k-dimensionul (vase la figura 5.1).
El espacio del rango del vector aleatorio [ X , ,X,, . . . ,X,] es el conjunto de
todos los valoresposibles del vectoraleatorio. Puede representarsecomo
Rx, y x, / x X,, donde
126
ste es un producto cartesiano de los conjuntos del espacio del rango para las
componentes. En el caso en el que k = 2, esto es, donde tenemos un vector
aleatorio bidimensional como en los ejemplos que se han presentado, Rx,xx2 es
un subconjunto del planoeuclidiano.
5-2
127
x2 (libras)
x2
"
"
_x_
"
"
-.."-.I
..." - ..
I2a
Definicin
Funciones de probabilidad bivariadas:
1. Casodiscreto. Para cada resultado [x,,,x2] de
[X,,
X,], asociamos un
nmero
P(X,,7
x,,)
p ( XI
x1, Y
x2 = x2,)
donde
p ( x , , ,x 2 , ) 2 O
paratodo i , j
Los valores ([x1,, x,), p(x,,, x,)) para toda i, j forman la distribucin de
probabilidad de [X,,X , ] .
2. Caso continuo. Si [X,,X,]es un vector aleatorio continuo con espacio del
P(al
X,
I
b,, a 2
X,
b,)
/ 2 / h 1 j ( x l ,x 2 )d x ,d x 2
u2
5-2
a1
129
61
P(al
X,
bl, a,
X,
b,) esta
En el casoen que[X,,
X,]sea discreta, podramos presentar la distribucin de
probabilidad de[X,,X,] en forma tabular grficao, en algunos casos, matemhtica.
En el caso donde[X,,
X,]sea continua, solemos emplearuna relacin matemtica
para presentar la distribucin de probabilidad; sin embargo, una representacin
grhfica puede en algunas ocasiones ser til.
Ejemplo 5.3 Una distribucin de probabilidad hipottica se muestra tanto en
forma tabularcomo grfica en la figura5.5 para las variables aleatorias definidas
en el ejemplo 5.2.
Ejemplo 5.4 En el caso delos dihmetros de soldadura representadosporX, y la
resistencia a la tensin representada por X,,podramos tener una distribuci6n
uniforme como la siguiente:
=o
en caso
otro
130
CAPiTULO 5
N
-
O
1
2
3/30
3/30
1/30
3/30
2/30
4/30
3/30
1/30
1/30
2/30
1/30
1/30
3/30
x1
b)
5-3
131
DISTRIBUCIONES MARGINALES
x2 =
Figura 5.6
y la distribucin marginal de X , es
P2(X2,) = C r , ( X l , , X 2 , )
j = 192,".
(5-3)
todo i
132
8/30
1
O
7f30
, 1/30
X1
b)
9/30
2
C)
5-3
133
DISTRIBUCIONES MARGINALES
f, (x,1
L1
O.2
2.000
x2
b)
Figura 5.8 Distribucionesmarginalespara
un vectoruniformebivariado
Distribuci6n marginal deX,. b) Distribuci6n marginal de X.,
[X,, X,]. a)
1
f ( x l , x 2 )= 500
OI
x1 < .25,0-1 x 2 I 2000
=o
en otro
caso
Las distribuciones marginales deX,y X,son
=o
caso en otro
=o
en otro caso
CAPITULO 5
134
DISTRIBUCIONES DE PROBABILIDAD
CONJUNTA
V(X,)=+
30
30
7
7
8
7
02.-+12.-+2*.-+32.-+42.
30
30
5-3
DISTRIBUCIONES MARGINALES
135
La media y la varianza deX , podran determinarse tambidn empleando la distribuci6n marginal deX,.
Las ecuaciones 5-6 a la 5-9 muestran que la media y la varianza de X , y X,,
respectivamente, pueden determinarse a partir delas distribuciones marginaleso
directamente de la distribucin conjunta.En la prctica, si ya ha determinado la
distribucin marginal, suele serms sencillo utilizarla.
En el caso donde [X,,
X,]es continuo, entonces
En las ecuaciones 5-10 a la 5-13 observamos tambikn que podemos emplear las
densidades marginales o la densidad conjuntaen los clculos.
Ejemplo 5.8 En el ejemplo 5.4, la densidad conjuntade los dimetrosde
soldadura, X,,y la resistencia al corte,X,, fueron dados como
1
j(x1, x2) = 500
=o
O2
X,
en otro
caso
< .25, O 5 x 2 I
2000
CAPiTULO 5
136
DISTRIBUCIONES
PROBABILIDAD
DE
CONJUNTA
OI
x 1 < .25
en otrocaso
Y
1
f h 2 )
0 I x 2 I 2000
=o
encaso
otro
Al trabajar con las densidades marginales, la media y la varianza de X,son
entonces
E ( Xl)
pL1=
['25x I . 4 d x ,
JO
2( . 2 q 2 = .125
Y
X:.
4 dx1 - (.125)2 =
4
3
(.125)2 2 5.21
10-
PX2,,,JX*,)=
i
PdXl,)
1 , 2,...; j
1 , 2, . . .
(5-14)
5-4
DISTRIBUCIONES CONDICIONALES
137
3/30
PX,l3(1)
4/30 = 4
pxl,3(xl,)= O
en otro caso
Si [X,,
X,]es un vector continuo aleatorio, las densidades condicionales son
(5-16)
Y
x2.
Cociente
/7/30
m =7 1
(5-17)
2
I
4
I
138
dondef,(x,)
0 Y.&*) o.
=o
en otro caso
=o
en otro caso
=o
Las densidades marginales semuestran en la figura 5.1 1.
en otro caso
5-4
139
DISTRIBUCIONES CONDICIONALES
Figura 5.11
=o
en otro caso
CAPiTULO 5
140
1 I2
Figura 5.12
DOS
1
densidades condicionales
fXzlrn
fx2,1,
ejemplo 5.10.
3 ' 6
=
o.
en otro caso
Ntese que parafXX,(x2),hay un nmero infinito de estas densidades condicionales, una para cada valor O < x I <. Dos de stas&,.Z(x2) y&,(x2) se muestran
3x:
(x, 1 =
fx,,o,
fX,,,,
+x,
X1
5-5
ESPERANZA CONDICIONAL
141
en la figura
5.12. Ademhs parafX&,), hay un nmero infinito deestas densidades
condicionales, una para cada valor O S x, S 2. Tres de estas se muestran en la
figura 5.13.
(5-18)
Y
(5-19)
Observeseque habrh una E(X,lx,,) para cada valor de x,,. El valordecada
E(X,Ix,,) dependerh del valor de x,,, que, a su vez, esta gobernado porla funcin
de probabilidad. De modo similar, habr tantos valores de
E(X,lx,) como valores
xl, y el valor de E(X,lx,) dependerh del valor de xl, determinado por la funcin de
probabilidad.
Ejemplo 5.11 Considerese la distribucin de probabilidad del vector aleatorio
discreto [X,, X,], donde X , representa el nmero de 6rdenes de compra de una
gran turbina en julio y X, representa el nmero de 6rdenes en agosto. La distribuci6n conjunta, asi comolas distribuciones marginales se presentan en la figura
5.14. Consideraremos las tres distribuciones
condicionales,px,lo,P ~ , ~ , , yy ~los
~,~,,
valores esperados condicionales de cadauna:
1
Px2,0("2,) =
6:
2
x, = 1
= -
=-
1
6'
x, = 3
=-
O,
en otro caso
= -
6'
2
- 6,
"
= -
Px212(X2,)=
x2, = 0
s2,
lo '
1
2
E(X2JO)=0.-+1.2
4-2. 6
+ 3 . - = 1.5
6
lo '
-I
lo '
-1
O,
x,, =
1
- 4'
3
1
+2."+3.-=1.4
10
10
XI,=
"
5
+ 1 .10
x2, = 1
en otro caso
1
E(X,(l) = O ' 10
x2, = 0
= -
x,, = 2
x>,
T?
E(X,12)
o,
x2, = 3
O,
en otro caso
O'
1
-
+1
1
'
1
+2.-+3.0=.15
4
CAPiTULO 5
142
DISTRIBUCIONES DE PROBABILIDADCONJUNTA
Si [X,,
X,]es un vector aleatorio continuo, las esperanzas condicionales son
(5-20)
Y
(5-21)
y en cada caso habrb un nmero infinito de valores que el valor esperado puede
tomar. En la ecuacin 5-20 habrh un valor de E(X,Ix,) para cada valorxq, y en la
ecuacin 5-21 habrb un valor de E(X,lx,) para cada valor x l .
Ejemplo 5.12 En el ejemplo 5.10, consideramos una densidad'conjunta f ;
donde
x2) = x:
fbl,
XlX2
+ "j-
=o
Las densidades condicionales fueron
O<X1<1,OIX,I2
en otro caso
5-6
REGRES16N DE LA MEDIA
143
+4
9x, + 3
9x,
-~
-
Debe notarse que sta es una funcin de x , . En las dos densidades condicionales
mostradas en la figura 5.12, donde x, = f y x, = 1, los valoresesperados
correspondientes son E(X,lf) = y E(X,I I ) =
Puesto que E(X21x,)es una funcin de x,, y x, es un valor de la variable aleatoria X,,
E(X,JX,) es una variable aleatoria, y podemos considerar el valor esperado de E(X2(X,),esto es, E[E(X,(X,)]. El operador interior es la esperanza de X ,
dada X,= x,, y la esperanza exterior es con respecto a la densidad marginal de
X , ; por tanto
+ 4)/(9xI + 3).
El operador vuriunzu puede aplicarse alas distribuciones condicionalesexactamente como en el caso univariado.
5-6
Regresin de la media
144
E(%
X1
a)
//
( X 2 I x l ) = 9x1 + 43 9x1
* x1
1
a)
5-7
INDEPENDENCIAALEATORIAS
DE VARIABLES
14s
Ejemplo 5.14 En el ejemplo 5.12 encontramos E(X,lx,) para la densidad bivariada del ejemplo 5.10, esto es
=o
caso
en otro
El resultante fue
2x2 + 3
"
2x2
+4
Definicin
l . Si [X,,X,] es un vector aleatorio discreto, decimos entonces que X,y X ,
son independientes si y s610 si
para todo i y j .
"
"
.~~~
.-
.IIIII""
146
2. Si [X,,
X,] es un vector aleatorio continuo, decimos entonces que X , y X ,
son independientes si y slo si
f h x ? _ )= f d . 1 )
(5-25)
. f 2 ( 4
Teorema 5-1
l . Sea [X,,
X,] un vector aleatorio discreto. Entonces
P 4 X 2 , ) =P 2 b 2 , )
Y
PX,,,,(
x1,) = PI ( x 1 , )
=f z ( x 2 )
Y
para todo x, y x2 si y s610 si X,y X,son independientes.
- 0
0.02
0.04
0.06
0.04
0.04
p z (x2.1
0.2
5-8
COVARIANZA Y CORRELAC16N
i47
y correlacin
5-8Covarianza
,u,
Definicin
Si [X,,
X,]es una variable aleatoria bidimensional, la covarianza, denotada por
0 1 2 9 es
cov ( x, x,)
p=
==
(5-27)
[ E ( x,). E ( x,)]
(5-28)
/m./m
9
012
.
"
...-.-
".
148
Teorema 5-2
Si X, y X , son independientes, entonces p = O.
Prueba Si X , y X , son independiente,
Teorema 5-3
El valor de p estar&en el intervalo [-1,
+ 11, esto es
-1 Ip I +1
E[(Xl - E(XI)) + ~ ( X -Z E ( X 2 ) ) I 2
Figura 5.18
La Q(t) cuadrltica
149
+ t 2 ~ [ -x E2 ( x , ) ] ~
Puesto que Q(t)3 O, el discriminante de Q(t)debe ser S O, por lo que
de modo que
Y
-1 I p 5 +1
(5-29)
Ejemplo 5.16 Un vector aleatorio continuo[X,,X,] tiene una funci6n dedensidad como la siguiente:
- x2 < x1
f(x,, x2) = 1
=
< +x,,
o < x2
<1
enotrocaso
1 - x1
1 + x1
=o
Y
=o
Puesto que Axl, x*) # &(x,) . f2(xz),
calculamos la covarianza, obtenemos
.."
"
.
"""I.I
x2 < 1
en otro caso
las variables no son independientes. Si
f 2 ( x * ) = 2x2
150
CAPTULO 5
DISTRIBUCIONESDEPROBABILIDADCONJUNTA
x, = - x 2
c c
F(x,, x*) =
y si
P(47
b )
(5-31)
-33
[X,,
X,]es continua, entonces
P ( x , , x,)
/x'
"m
/"
-m
f(t,, t 2 ) dt, d t ,
(5-32)
5-9
151
Figura 5.20
=o
> o,
encaso
otro
X1
X2
> 0,
X1
iX2 <
0<x1<1
x,+x,<1,
F ( x l , x * ) = ~ x 2 i 1 - r ' 2 4 / 1 tdt,
2 dt2
= 6x22 - 8x:
+ i 1 - x 1 ~ 1 - r 2 2 4 t 1 dt,
t 2 dt,
=O
XI
>o,
encaso
otro
x2
> o, XI + x2 < 1
152
CAPITULO 5
Figura 5.21
e) O<x,<1 y x2>1,
dt2 dt,
F ( x , , x 2 )= jd(141-r124f1t2
=
6 ~ :- 8 ~ :+ 3x14
f) O 5 x , r l y q 2 1 ,
F(x,, ~
g)
x, 2 1 y
2 =
)
6xf - 8 ~ : 3 ~ ; '
x2 2 1,
F(x,,x2)
5-10
FUNCIONES DE DOSALEATORIAS
VARIABLES
153
%(YO
O
1
2
3
4
5
6
7
8
9
en otro caso
0.10
0.15
0.20
0.05
O.5
0.02
0.03
0.04
0.01
o. 1
0.2
0.3
0.4
o. 1
.13
.11
.19
.15
.21
.O7
.O5
.o1
O
P, (x,,)
Figura 5.22
.o2
.O6
.__
.-
_l_LII_
_I^.
- ..
154
ax,
JY
ax,
-
aZ
ax,
__
ax,
__
aZ
ay
5 . La densidad conjunta de
siguiente forma:
I
(5-36)
Ejemplo 5.19 Considrese el vector aleatorio continuo [X,,
X,] con la densidad
siguiente:
f ( x L .x ? )
4e
=o
'('lT'2'
x, >
o.
X?
>
caso
en otro
y elegimos z = x,
155
Por consiguiente,
J(y,z ) =
(1 + y > *
Z
(1 + Y )
1
Y
=
4e-2~
En consecuencia,
=o
casootro en
CAPITULO
5 DISTRIBUCIONES DE PROBABILIDADCONJUNTA
156
En consecuencia
I
P(al
X,
I b,, a2 S
/ '/
- . l b n f ( x , , x*, . . . , x,)
h h ,
X,,
b,)
(5-38)
"n
"2
"1
I b2,..., a , I
X,
Definicin
Las variables[X,,
. . . ,X,] son variables aleatorias independientes si y slo si para
toda [xl, x2, . . . ,x,]
E( X,)
1"
/m
-m
-a,
..
100
"X,
!(xl,
X,,.
. . , X,)
dx, dx,
..
dx, (5-40)
y la varianza es
V (X , )
/m/m
-m
* ..
-a,
jm( x , - p,)'
-m
. f ( x , , x,,
5-12
COMBINACIONES LINEALES
157
La grfica hipotticas de E(X,Ix,, . . . ,x,,) como una funci6n del vector [xz, . . . ,
x,,] se llama la regresin de X,sobre
(X,,
. . . ,X,,).
H ( x,,x,,. . . , x,)= a ,
+ q x , + ... + a , x ,
(5-44)
+ X,.
158
x,
x
2
x3
x4
1
x = -(x1
+ x, + ... +x1,)
10
El valor X = f X ,
a, = a, =
. . . = a , , = h.
x, + x,
(5-45)
E[(XI + Xd] - [ H X l +
x2>12
159
u; = u;
+ u; + 2u1,
(5-47)
= a,
+ U l X 1 + a2X2+ . * -+unx,,
(5-48)
como sigue:
v( Y ) = 1 u,'V( x,)+
aiai c o v ( x,,
x,)
(5-50)
O
r=l
j=l r=l
r#j
si
V ( Y )=
u,'
V(XJ
(5-51)
r=1
O
160
+ P 3 + P4
P Y = P1
u; = u;
+ u; + u, + u:
P2
Y
No hemos afirmado an nada acerca de la distribucibn de U; sin embargo, dadas
la media y la varianza de X , , X,, X , y X,, podemos calcular sin dificultades la
media y la varianza de Y puesto que las variables son independientes.
Ejemplo 5.24 En el ejemplo 5.21 dondese ensamblaron doscomponentes,
supbngase que la distribucibn[X,, X,]es
f ( x , , x 2 ) = 8e-(2xl+4x2)x,
=o
caso otro
o,
x2 2
en
V ( X 2 ) = u; =
x;. 4e-42d~2 -
(fi
1
16
= -
16
Ejemplo 5.25 En el ejemplo 5.22, podriamos esperar que las variables aleatorias
X,, . . . , X , , fueran independientes debido al proceso de muestre0 aleatorio.
Ademhs, la distribucibn para cada variableXi es idkntica. Esto se muestra en la
5-13
161
x- = 1"x, + ...
10
1
+,
x
1
0
En consecuencia
1
.(X)=Px=-..(Xl)+10
=
-p+
10
-p+
10
1
10
-(.
1
X,)+...+--.(X,,)
10
...
+
=P
Ademhs,
U'
"
10
4 4 )
%(at)
(5-52)
+ X , + . . . + X,,
162
CAPITULO 5
M&)
M,&)
. M,&)
. - . . -M,&)
(5-53)
Las combinaciones lineales serhn de particular importancia en los ltimos captulos, y las estudiaremos otra vez
con mayor detalle.
P{F}=l-p=q
permanece constante paraj = 1,2, . . . ,n. Sea
O , si el ensayojsimoresultaen fracaso
O,
si elensayojsimoresulta
en Cxito
r=x,+x,+x,+... +x,,
Detalmodo
Y representael nmero de Cxitosen n ensayos; y Yln es una
aproximaci6n (o estimador) para la probabilidad desconocida p . Por conveniencia, dejamosque p = Y/n. Ntese queeste valor corresponde al trmino fA
utilizado en la definici6n dela frecuencia relativa del captulo 2.
La ley de los grandes nmeros establece que
(5-54)
163
o en forma equivalente
(5-55)
E@)
-n . E ( Y ) = p
(5-56)
[i]
2
v(1)=
V ( Y )=
P O -P>
n
por lo que si
entonces
-PI < 1
00
(Y
(5-58)
164
CAPITULO
5 DISTRIBUCIONES DE PROBABILIDAD CONJUNTA
(5-59)
P(1 -P>
( .01)2 * (.05)
Puesto que p se desconoce, debe suponerse el peor caso posible [ntese que
p(1 - p ) es miximo cuando p = +].Esto da como resultado
n 2
(.5>(.5>
(.01)( .05)
50,000
5-16
EJERCICIOS
5-15
165
Resumen
5-16 Ejercicios
5-1
c)
5-2
CAPTULO 5
166
DISTRIBUCIONES DE PROBABILIDAD
CONJUNTA
a)
k
f(x17 x2) =
=o
a)
b)
c)
5-4
olx,I1oo,oIx,l1o
caso
otro
en
=o
I x1 I
2,2 I
XZ
I4
en otro caso
a)
6)
5-5
Dadalafuncinde
densidad
f(w,x,y,z)=16wxyz
=o
a)
b)
c)
O ~ w ~ 1 , 0 ~ x ~ 1 , O ~ y ~ 1 ,
encaso
otro
f.
+.
167
5-16 EJERCICIOS
5-6
= o caso otro en
Encuentre las densidadescondicionalesfm(x) yfvx ~ ) .
5-7
Con respectoa los datos enel ejercicio 5-2 determine el nmero esperado de unidades
por orden. En el casoen que haya tres rdenes porda.
5-8
Considere la distribuci6n de
probabilidad del vector aleatorio discreto[XI,
X*],donde
X I representaelnmerodepedidosdeaspirinaenagostoenlafarmaciadel
vecindario y X, representa el nmero de pedidos en septiembre. La distribuci6n
conjunta se muestraen la siguiente tabla:
a)
Encuentrelas distribucionesmarginales.
b) Determine las ventas esperadas en septiembre, dado que las ventas en agosto
fueron 51, 52, 53, 54, o 55, respectivamente.
5-9
=O
O I x1 _< 1 , 0 _< x2 i 1
en otro caso
a)
b)
c)
168
CAP~TULO5
o 5 SI
en otro
caso
=o
en otro caso
Debe tenerse cierto cuidadoal determinar los lmites deintegracin debido a que la
variable de integracin no puede tener valores negativos.
5-13 Suponga que [ X , Y ] es un vector aleatorio continuo y que X y Y son independientes
de manera que Ax, y ) = g(x)h(y). Defina una nueva variable aleatoria Z = M Y .
Demuestre que la funci6n dedensidad de probabilidad de Z, eZ (z), est dada por
g"(v>
- I'
=o
h,(i)
3e-3'
=o
v20
en otro CaSO
i2O
caso
otro
en
169
5-16 EJERCICIOS
I/
e I son variables
5-15 La demanda para cierto producto es una variable aleatoria que tiene una media de
20 unidades por da y una varianza de9. Definimos el tiempo de envo como el que
transcurre entre la colocacin del pedido y su entrega. El tiempo de envo para el
producto se fija en cuatrodas. Obtenga el valor esperado y la varianza deitiempo
de envo de demanda, suponiendo que las demandas se distribuyen en forma independiente.
5-16 Demuestre con detalle las partes a) y b ) del teorema 5-1 (pgina 146).
la funcin
M.,( t )
eA'Mxl(B t )
f(x1,x*)=2
O I X , I X , I l
O
en otrocaso
Encuentre el coeficiente de correlacin entreXI y X,.
=
+ DX2, donde A ,
170
-1
5-24 Sean
E [ E( XIY)I
E( X )
W)l
E( Y)
E [ E(
=o
I40
en otro caso
10 I d I 30
=o
en otro
caso
f(x,y)=x+y
=o
O<x<l,O<y<I
en otro caso
obtenga lo siguiente:
a)
EtXlvl
E[X1
c)
E[Yl
5-28 Para la distribuci6n multivariada
h)
=o
caso en otro
5-16
EJERCICIOS
a)
Evale la constante k.
b) Encuentre la distribucin marginal de X.
S-29 Para la distribucin multivariada
=o
a)
b)
en otro caso
Evale la constante k.
ObtengaF(x, y ) .
S-30 El gerente de un pequeilo banco desea determinar la proporcin del tiempo que un
g(x, y ) = 4xye-(x2+-v2)
b ) f(x, y ) =
c)
f ( x , y ) = 6(1
+ x + y)-4
Y son independientes.
x20, y 2 0
o l x l y s l
x 2 O, y 2 O
b)
=O
en otrocaso
Cul es la probabilidad de que la solicitud de la mercanca y la recepcibn de
un pedido ocurra durantela primera mitad del da?
Cual es la probabilidad de que la solicitud dela mercanca ocurra despus de
su cobranza? Antes de su cobranza?
llega. Cual es la
d) Z=e'
Captulo 6
Algunas distribuciones discretas
importantes
6-1
Introduccin
6-2
8,:
Realizacin de un experimento (eljsimo) y observacin del resultado.
L y / :
{S, F }.
. "_
.."""""""
_
l
_
L
"
174
Y
p,(x,)
=P(X,)
[:
(I - p )
*p*(x2)
. . . . -Pn(%J
x,=
1, j = 1,2 )...(n
X, =
O, j
= 1,2 ,..., n
(6-1)
casootro en
Paraun ensayo, la distribucindada en la ecuacin 6- 1 y la figura 6 . 2 se denomina
la distribucih de Bernoulli.
La media y la varianza son
E(X,)
+ (1 . p ) = p
(O. q)
p ) ] - p2
=p(l -
p)
(6-2)
6-2
175
.
I
Figura 6.2
O
Distribucibn de Bernoulli
.Y'=
{ ( x ,,..,, x n ) : x i = S
F, i
1 ,..., n }
Ejemplo 6.2 Supngase un experimento compuestopor tres ensayos de Bernoul l i y que la probabilidad de xito es p en cada ensayo (vase la figura 6.3). La
variable aleatoria X est dada por X = X;= ,X,. La distribucin de X puede
determinarse de modo siguiente:
O
1
2
P { F F F } = 4 . q *c / =q3
P { FFS} + P { F S F ) + P { S F F } = 3pq2
P(FSS} + P { S F S } + P { S S F } = 3p%
P { S S S } = p3
176
Figura 6.3
Rx
=o
0 , 1 , 2 ,..., n
en otro caso
(6-4)
P { x Bxitos en n ensayos}
-1
P SSS ... SS F F . . . FF
=pxq-x
(donde q = 1 - p ) debidoalaindependenciade
t)
6-3
177
DISTRIBUC16N BINOMIAL
P b )
x = O , 1 , 2 ,..., n
(:)pXqn-"
=o
casootro en
E ( X ) =P X Px -X
x=o
n!
x!(n- x)!
y dejandoy = x
nP
c (x
x=l
- I)!
(n
I)!(n - x ) !
Px-lqn-x
-1
por lo que
E(X)
np
v ( x )=
=
x2n!
r=O
x ! ( n - x)!
P x T x - (nP l2
n-2
( n - 2)!
x=o
y ! (n - 2 - y ) !
n(n - 1 ) p 2
p ~ q n - 2 - ~+
nP - ( n P ) 2
de manera que
V(X )
='
npq
+p
np
Y
V ( X )= p q + p q
+pq
npq
178
p ( x ) = 1~0)(.01)x(.99)'w-x
=o
caso
0,1,2,.
.loo
en otro
P ( X I 2)
( '~0)(.01)"(.99)'w-x
=
x=o
( .99)'O0
+ 1OO(.O1)'(
+ 4950( .01)2(.99)9x
= .92
En consecuencia, la probabilidad de que el inspector pare el proceso es aproximadamente 1 - (.92) = .08. El nmero medio depiezasdefectuosasquese
encontraran es E(X) = np = 100(.01) = 1, y la varianza es v(X)= npg = .99.
Transportador
Proceso
Figura 6.4
Almadn
6-3
179
DlSTRlBUCldN BINOMIAL
6-3.2Distribucidnbinomialacumulativa
La distribucin binomial acumulativa o la funcin dedistribucin, F, es
Esta funcin se ha tabulado en forma extensiva. Por ejemplo, vCanse las tablas
binomiales 50-100 de Romig (1953) y laDistribucin deprobabilidad binomial
acumulativa (1955).
de la distribuci6n binomial
E(j)
1
= -
.E(X)
1
-np = p
n
(i) v ( x )
2
v ( j )=
1
7
. n
(6-10)
P4
npq =
(6-11)
(6-12)
B 5 po) = P( X
f[~~Poll
np,)
=
x=o
(:)pxq'-x
(6-13)
180
Operacidn de
desengrase J
Operacidn de
pintura J + 1
Operacidn de
empaque J 2
1 - P ( fi S .071p
1 - P( X
1-
14
k=O
.05)
I
200(.07)lp =
.OS)
( 2~)(.05)k(.95)2
1 - .917 = .O83
X(t )
1
=O
retrasoevitable
en
otro
caso
960
480 min.
min.
w.
Figura 6.7
La distribucibn binomial.
182
Figura 6.8
p(x - 1) parax < ( n + l)p, yp(x) < p(x - 1) parax > (n + 1)p. Si (n + 1)p es
un entero, digamos m, entonces p(m) = p ( m - 1). Slo hay un entero tal que
(n
+ 1 ) p - 1 < m I( n + 1 ) p
=o
x = 1,2, ...
otro
en
caso
Y
p (X ) 2 0
paratodox
(6-14)
6-4
DlSTRlBUCldN GEOMETRICA
Ia3
(6-15)
a 2 = q/p2
(6-16)
M,@)
Per
1 - qe'
(6-17 )
+ $5OoO( X - 1)
= (30,000) X + ( - 5000)
C ( X ) = $25,00OX
En consecuencia
E [C ( X ) ]
=
=
$30,000 . E ( X ) - E($SOOO)
:1
30,000 . - - 5000
Si la probabilidad del Bxito en un solo ensayo es, por ejemplo, .25, entonces la
E[C(X)]= $30,000/.25 - $5000 = $1 15,000. Este puede ser o no aceptable para
Ia4
el experimentador. Debe tambidn reconocerse que esposible continuar indefinidamente sin que se logre un experimento exitoso. Supngase que el experimentador tiene un mximo de$500,000. Puede desear obtener la probabilidad de que
el trabajo experimental costara ms de esta cantidad, esto es,
(x >
= P( X
___
30,000
> 16.833)
1 - P ( X 5 16)
1-
16
.25( .75)""
x=l
16
1 - .25
(.75)""
x=l
= .o1
El experimentador puede no estar dispuesto acorrer el riesgo (probabilidad .01)
de gastar $500,000 disponibles sin obtenerun resultado exitoso.
La distribucibn geometrica decrece, esto es, p ( x ) < p ( x - 1) para x = 2, ... .
Esto se muestra grficamente en la figura6.9.
Una propiedad interesantey til dela distribucin geomdtrica es queno tiene
memoria, esto es
P(X >x
4-
SIX > S )
P ( x > x)
La distribucih geomktricaeslanicadistribucindiscretaquetieneesta
propiedad de falta de memoria.
(6-18)
6-5
DlSTRlBUClON DE PASCAL
185
caso
=o
otro
en
(6-19)
hay
(:I;)arreglosquesatisfacenesta
Figura 6.10
(6-20)
186
o2 =
rq/p2
(6-21)
Y
(6-22)
Ejemplo 6.7 El presidente de una gran corporacin toma decisiones lanzando
dardos sobre un tablero. La seccin central est marcada con s y representa
un xito. Laprobabilidad de que su disparo seaun s es .6, y esta probabilidad
permanece constante de lanzamiento a lanzamiento. El presidente contina sus
lanzamientos hasta que logra tres blancos. Denotamos con X el nmero del
ensayo en el cual logra el tercer blanco. La media es 3/.6 = 5, lo que significa
queenpromedioserequerirncincolanzamientos.Laregladedecisin
del
presidente es simple. Si consigue tres blancos en o antes del quinto lanzamiento,
decide a favor de la decisin en cuestin. La probabilidad de que 1 decidir en
favor es en consecuencia
p ( x 5 5)
6-6
=P(3)
+ P(4) + P ( 5 )
[;)(.6)3(.4)0
.6636
+ (i)(.6)3(.4) + (;)(.6)(.4)
Distribucibn multinomial
Una importacte y til variable aleatoria de mayor dimensin tiene una distribucin conocida comodistribucin multinomial. Supngase que un experimento 8
conespacio muestra1 Y se particiona en k eventosmutuamenteexcluyentes,
digamos B , B2,. . . , Bk. Consideramos n repeticionesindependientesde C? y
dejemos que p I = P(BJ sea constante de ensayo a ensayo, para i = I , 2 , . . . , k.
Si k = 2, tenemos ensayos de Bernoullicomo los descritos anteriormente. El
vector aleatorio, [X,,
X*, . , , X,], tiene la siguiente distribucin donde X , es el
nmero de veces que B, ocurre en las n repeticiones de 8, i = 1 , 2, . . . , k .
p a r a x , = 0 , 1 , 2 , . . . ; x , = O , 1 , 2 , . . . ; . . . ; x k = 0 , 1 , 2, . . . ; y d o n d e
C f = I x, = n.
Debe notarse que X , , X,, . . . ,X, no son variables aleatorias independientes
puesto que C 4- I X, para cualesquier n repeticiones.
6-7
DISTRlBUC16NHIPERGEOMsTRICA
x1!x*!x3!
x2 = 2 y xj = O (debemos tener x,
190( .85)''(.01)
= .lo5
=
,7
L \
188
nmerodeartculosen
distribucin deX es:
=o
la muestraque
caso
otro
en
(6-26)
Y
(6-28)
6-8
CISTRIBUC16N DE POISSON
189
1
t
t+
At
Sip
= .05,
entonces
ocurrencias relativas al tiempo, denominadas a menudo llegadas o nacimientos (vase la figura 6.1 I ) . La variable aleatoria de inter&, digamos X,,es el
nmero de llegadas que ocurren en el intervalo O, t. El espacio del rango Rx, =
{O, 1,2, . . . }. En el desarrollo de la distribucin de X,es necesario hacer algunas
suposiciones, cuya admisibilidad esth sustentada poruna evidencia emprica
considerable.
La primera suposicin es que el nmero de llegadas durante intervalos de
tiempo que no se traslapen son variables aleatorias independientes. Segundo,
hacemos la suposicin de que existe una cantidad positiva iltal que para cualquier
intervalo pequeiio de tiempo, At, se cumplen los siguientes postulados:
1. La probabilidadde que ocurrir con exactitud
una llegadaen un intervalo
190
P(X,= x) = p , ( t )
0,1,2, ...
(6-29)
por lo que
por lo que
Y
p;(t)
= Xpx-l(t)
Ap*(t)
x =
1,2, ...
(6-32b)
x =
o, 1 , 2 , . . .
(6-33)
6-8
DlSTRlBUCldN DE POISSON
191
cxe - c
P(X> =
=
x =
0,1,2, ...
O casoen otro
(6-34)
n(n
I)(n
2)...
(n
+ 1)
= -_______X!
AI dejar que n
trminos (1 -
I),(1
!).
..
todos se aproximana
1 como lo hace
-+
e' cuando n
m; por consiguiente, la
0
korma irnite de laecuacin 6-35 e s p ( x ) = (?/x!) . e', que es la distribucin de Poisson.
CAPITULO 6 ALGUNASDISTRIBUCIONESDISCRETASIMPORTANTES
192
=ce"
e
(.?
1 + - + - + ...
I!
2!
I
(6-36)
De modo similar,
por lo que
v( X ) = E ( X 2 ) - [ E ( X ) 1 2
(6-37)
E(.
Teorema 6-1
Si X,,X,,. . . , Xk son variables aleatoriasdistribuidasindependientemente,
teniendo cada cual una distribucibn de Poisson con parhmetro c,, i = 1, 2, . . , k
y Y = X, + X, + . . . + x,,entonces Y tiene una distribucin de Poisson con
parhmetro
c
c,
+ c2 + . . . t e ,
eCz(e"1).
=f e ( c) l + c ~ + ...
+c,)(e'-1)
6-8
193
DlSTRlBUCldN DE POISSON
P( x 5 K ) 2 .95
O
P(X >K )
.O5
por lo que
oc
e-c(c)x/x! 5 .O5
x=K+l
=o
caso
otro
en
194
CAPITULO 6 ALGUNAS
DISTRIBUCIONES
DISCRETAS
IMPORTANTES
Paraladistribucinhipergeomktrica,silafraccindemuestre0
nlN es
pequefa, digamos menor que . I , entonces la distribucin binomial con p = DIN,
y n proporcionan unabuena aproximacin. Cuanto ms pequea sea la razn nlD,
tanto mejor sera la aproximacin.
Ejemplo 6.12 Un lote de produccin de 200 unidades tiene 8 defectuosas. Se
selecciona una muestra aleatoria de
1O unidades, y deseamos encontrar la probabilidad de que una muestra contenga exactamente 1 unidad defectuosa.
Puesto que nlN = 6 = .O5 es pequeilo, sea p = & = .O4 y al emplear la aproximacin binomial
p (1) =
P(XI
6)
(4~0)(.001)~'(.999)4"~'
=
x=o
4000(.001) = 4
195
6-1 1 RESUMEN
Y
6
P( X
I 6) =
e-4(4)x/x!
.S89
x=o
6-1O
Generacin de conversiones
Existenesquemasparautilizar
nmeros aleatorios,como se describi en la
seccin 4-6, con el fin de generar conversiones de las variables aleatorias ms
comunes.
Con los ensayos de Bernoulli, podramos generar primero
un valor u, como la
isima conversin de U, donde
f(u)
1; o I u I 1
= O; en otro caso
6-1 1 Resumen
Las distribuciones presentadas en este captulo tienen un gran uso en las aplicaciones en ingeniera, ciencias y administracin. La seleccin de una distribucin
196
!2
P
I 2
i
I2
C
r
Vi
v
3
6-12
EJERCICIOS
197
6-12
Ejercicios
6- 1
6-2
6-3
6-4
6-5
6-6
6-7
6-8
Suponga que una muestra aleatoria de tamalio 200 se toma de un proceso que tiene
una fraccin de defectos de.07. Cul es la probabilidad de que; exceda la fraccin
verdadera de defectos en una desviacin estndar? En dos desviaciones estndar?
En tres desviaciones estndar?
6-9
disparo exitosoes,encualquierprueba,
198
pendientes, cul es la
disparo?
6-10 Un agente de bienes races estima que la probabilidad de vender una casa es .IO. El
da de hoy tiene que ver cuatro clientes. Si tiene xito en las primeras tres visitas
cul es la probabilidadde que su cuarta visita no sea exitosa?
6-11 Suponga que se
van arealizarcincoexperimentos
de laboratorio idhticos independientes. Cada experimento es en extremo
sensible a lascondiciones ambientales,
y slo hay una probabilidadp de que se terminar con xito. Grafique, comouna
funcin dep , la probabilidad de queel quinto experimento seael primero que falle.
Obtenga matemticamente el valor de p que maximice la probabilidad de que el
quinto ensayo sea elprimer experimento no exitoso.
6-12 La compafia XYZ planea visitar clientes potenciales hasta que serealice una venta
generatriz de momentos.
6-14 La probabilidad de queun submarino hundaun barco enemigo conun disparo de sus
de marzo.
6-16 Un cliente potencial entraa una agencia de automviles cadahora. La probabilidad
de que una vendedora cierre una
transaccin es . I O . Si ella est determinada a
continuar trabajando hasta que venda tres carros, cul es la probabilidad de que
tenga que trabajar exactamente ocho horas?Y ms de ocho horas?
6-12
199
EJERCICIOS
est dada como indicala ecuacin 6-22. Emplee sta para determinarla media y la
varianza de ladistribucin de Pascal.
6-19 Laprobabilidaddeque
q
q
= ( x 210)
P(T1)
(10 < x I l l )
(11 < x
(11.5 < x)
11.5)
p ( T * ) = .2
p ( T , ) = .2
200
b)
Cules laprobabilidaddelaaceptacindel
distribucin binomial con p = A?
6-26 Suponga que en el ejercicio 6-25 el tamaiio del lote ha sido 100. Ser satisfactoria
la aproximacin binomial en este caso?
6.27 Una compradora recibe lotes pequeiios ( N = 25) de un dispositivo de alta precisin.
Pretende rechazar el lote el 95 por ciento delas veces si contienen hasta siete
unidades defectuosas. Suponga que la compradora decide que la presencia de una
unidad defectuosa en la muestra, es suficiente para provocar el rechazo. Qu tan
grande debe ser el tamao de su muestra?
6-28 Demuestre quela funcin generatriz de momentos de la variable aleatoria
de Poisson
es como indicala ecuacin 6-38.
6-29 Se estima que el nmero de automviles que pasa por un cruce particular por hora
es de 25. Obtenga la probabilidad de que menos de I O vehculos crucen durante
cualquier intervalo de una hora. Suponga que el nljmero de vehculos sigue una
distribucin de Poisson.
6-30 Las llamadas llegan a un tablero de control telefnico de modo tal queel nmero de
llamadas por horasigue unadistribucin dePoisson con media 10. El equipo
disponible puede manejar hasta 20 llamadas sin que se sobrecargue. Cul es la
probabilidad de que ocurra dicha sobrecarga?
6-31 El nmero de clulas de sangrepor unidad cuadrada visible bajo el microscopio sigue
una distribucin de Poisson con media 4. Encuentre la probabilidad de que ms de
5 de tales clulas de sangresean visibles para el observador.
6-32 Sea X , el nmero de vehculos que pasan por una interseccin durante un intervalo
la distribucinde Poisson con un parmetro
de tiempot. Lavariable aleatoriaX, sigue
h . Suponga que se ha instalado un contador automtico para contar el nmero de
vehculos que pasan. Sin embargo, este contador no est funcionando de manera
apropiada, y cada vehculo quepasa tiene una probabilidadp de no ser contado. Sea
Y, el nmero de vehculos contados durante
t. Determine la distribucin de probabilidad de Y,.
6-33 Una compaa grande de seguros ha descubierto que .2 por ciento de la poblacin
de Estados Unidos est
lesionada como resultado de algn tipo de accidente particular. Esta compaa tiene15,000 asegurados que estn protegidos contra
tal accidente.
Cual es l a probabilidad de que tres o menos reclamos se entablen en relacin con
esas plizas de seguro duranteel siguiente ao? Cincoo ms reclamos?
6-34 Cuadrillas de mantenimiento llegan a un almacn de herramientas solicitando una
pieza de repuesto particular de acuerdo una
con distribucin de Poisson con parmetro A = 2. Tres de estas piezas de repuesto por l o general se tienen disponibles. Si
ocurren ms de tres solicitudes, las cuadrillas deben
desplazarse a una distancia
considerable hasta los almacenes centrales.
6-12
EJERCICIOS
201
a)
202
CAPTULO 6 ALGUNAS
DISTRIBUCIONES
DISCRETAS IMPORTANTES
a) produzca
500 conver-
1
=
( y , + y 2 + . . . + y500), la media de estamuestra.
500
~
Captulo 7
Algunas distribuciones
continuas importantes
7-1 Introduccin
Estudiaremos ahora varias distribuciones de
probabilidad continuas importantes.
Ellas son las distribuciones uniforme, exponencias, gamma y de Weibull. En el
captulo 8 se presentar la distribucinnormal y otras distribuciones de probabilidad relacionadas con la misma. La distribucin normal es quiz la m& importante de todas las distribuciones continuas. La razn por la que se pospone su
estudioesqueladistribucinnormal
es lo bastanteimportantecomopara
dedicarle un captulo por separado.
Se ha observado queel espacio del rango para una variable aleatoria continua
X consta de un intervalo o de un conjunto de intervalos. Esto se ilustr en un
capitulo anterior, y se vio que est involucradauna idealizacin. Por ejemplo, si
estamos midiendo eltiempo de falla para un componente electrnico o el tiempo
para procesar un pedido a travCs de un sistema de informacin, los dispositivos
de medicin utilizados son tales que slo hay un nmero finito de resultados
posibles; sin embargo, idealizaremos y supondremos que el tiempo puede tomar
cualquier valor en algn intervalo. TambiCnen estecasosimplificaremos la
notacin donde no haya ambigedad, y dejaremosfAx) =Ax) y FAX) = F(x).
7-2
Distribucin uniforme
=o
caso
otroen
CAPTULO 7 ALGUNASDISTRIBUCIONESCONTINUASIMPORTANTES
204
f(x)
cy
Figura 7.1
Densidaduniforme
y3
f(x)dx
7-2
DISTRIBUC16N
UNIFORME
205
(P
12
La funcin generatriz de momentosMAt) se encuentra del modo siguiente:
,I/{
(7-3)
- era
for t f O
(7-4)
-(Y)
Parauna variablealeatoriadistribuida uniformemente, la funcin dedistribucin F(x) = P(X S x) est dada por la ecuacin 7-5, y su grfica se muestra
en la figura 7.2.
F(x)= O
x < a
-
t(P
-l:
-
dX
x--(Y
-___
p-.
=I
q<x<p
(7-5)
X > p
Ejemplo 7.1 Se elige un punto al azar enel intervalo [O, I O ] . Supngase que
deseamos encontrar la probabilidad de que el punto est entre t y $.La densidad
de la variable aleatoria X es Ax) = , O S x S I O ; y Ax) = O, en otro caso. En
consecuencia, P(t X 5) = A.
?para
distribucin
la
L
variable
aleatoria
206
CAPITULO 7 ALGUNAS
DISTRIBUCIONES
CONTINUAS
IMPORTANTES
1
O
- .5 I x
en
otro
caso
I
+.5
caso = ootro
x 2O
en
(7-6)
207
Figura 7.3
Funci6ndedensidadexponencial.
x =
= e-"(Xt)X/x!
=o
0 , 1 , 2 , ...
casoen otro
(7-7)
P(0) = e
(7-8)
P(T > t )
e~
t 2 O
(7-9)
Y ,puesto quef(t)
P(T< t )
t 2 0
(7-10)
208
f ( t ) = he-''
t 2 O
= caso
o otro
en
(7-11)
+ 1e - h x dx = 1 / X
m
E( X )
/ m x X e - A x dx =
o
(7-12)
(l/X)'
l/h2
(7-13)
M,(t)
1-
:I"
(7-14)
7-3
DISTRIBUC16NEXPONENCIAL
209
(7-15)
La figura 7.4 describe la funci6n de distribuci6n de la
ecuaci6n 7- 15.
Ejemplo 7.4 Se sabe que un componente electr6nico tiene una vida til representadaporunadensidadexponencialcontasadefallade
fallas porhora
(estoes, il =
El tiempomediodefalla,
E(* es,por tanto, IO5 horas.
Sup6ngase que deseamos determinar la fracci6n de tales componentes que podran fallar antes de lavida media o vida esperada
.63212
"_
210
f ( x ) = he-hX , x 2 o;
en otro caso
1
( X ) =7
La media de una distribucibn exponencial.
Figura 7.5
componente dura menos de 400 horas, el fabricante debe pagar una multa de K
d6lares. SeaXel tiempo de falla de cada componente. En consecuencia
c, = c
= C + K
si X 2 400
si X < 4 0 0
kC
= kC f K
si X 2 400
si X 400
Y
C,
= (C
=
+ K)[1
+ K(l
- eC2]
+ C[e-*]
- e-2)
Y
E(C,)
+ K)/400300-1e-3M)x dx + k C 1 w 3 0 0 - 1 e - 3 m - 1dx
x
O
400
= (kC + K ) [ 1 - e - 4 / 3 ]+ k C [ e - 4 / 3 ]
=
(kc
kC
+ K(l -
7-4
DISTRIBUC16N GAMMA
21 1
P(X> x
x) =
+ S I X >
P(X> x
+ S )
P ( X > x)
e-x(x+s)
e-hx
e-XS
por lo que
P(X>x+slX>x)=P(X>s)
(7-16)
Funcidngamma
lim
jOkxn-le-x
dx
k+m
existe. Una importante relaci6n recurrente que con facilidad puede demostrarse
integrando la ecuaci6n 7- 17 por partes es
r ( n ) = ( n - l)r(n - 1)
(7-18)
r ( n ) = ( n - I)!
(7-19)
212
Figura 7.6
puesto que l-(1) = e-* dx = l . As, la funcin gamma es una generalizacin del
factorial. Se pide al lector en el ejercicio 7-17 verificar que
(7-20)
7-4.2
= o caso
otro
en
(7-21)
7-4.3
7-4
DlSTRlBUCldN GAMMA
213
s . *
+x,
(7-22)
donde
g(x,)
x/ 2 O
=o
encaso
otro
E( X )
r/X
(7-23)
V (X )
r/R
(7-24)
Y
Las ecuaciones 7-23 y 7-24 representan la media y la varianza sin importar que
r sea o no un entero; sin embargo,
cuando r e s un entero y se hace la interpretaci6n
dada en la ecuaci6n 7-22, es evidente que
r
E( X )
E ( X, j
r . 1/X
= r/A
/=I
Y
r
V( X )
V ( X,)
. 1/X2
r/X2
/'1
M&)
i :I"
1- -
(7-25)
214
La funcin de distribucin,F , es
=o
x 5 0
(7-27)
F(x)
1-
e-X(
>o
(7-28)
k=O
que es la suma de
los trminos de Poisson con media h.De tal forma, es posible
utilizar las tablas de
Poisson acumulativas para evaluar la funcin de distribucin
de la gamma.
Figura 7.7
Unidad 1
7-5
215
DlSTRlBUCldNDE WEIBULL
=o
caso
otro
en
=caso
o
otro
en
=o
caso
otro
en
(7-29)
Sus parhmetros son 'y, (< y < 03) el parmetro delocalizacibn, 6 > O el
parametro de escala, y p > O, el parmetro de forma. Mediante la seleccin
apropiada de estos parhmetros, esta funcin de densidad
se aproximarh de manera
muy cercana a muchos fenmenos observacionales.
La figura 7.8 muestra algunas densidades de Weibull para y = O, 6 = 1,
y p = 1,2, 3,4. Ntese que cuando y = O y p = 1 , la distribucin de Weibull se
reduce a una densidad exponencial con A = 1/6.
216
1.6
"X
0.4
Figura 7.8
1.2
0.8
1.6
2.0
p = 1, 2, 3 , 4.
Y
(7-31)
La funcin de distribucin tiene la forma relativamente
simple
(7-32)
Ejemplo 7.8 Se sabe que la distribucin del tiempo de fallapara subensambles
electrnicos tiene una densidad de Weibull con y = O, p = f, y 6 = 100. La
fraccin se espera queperdure hasta, digamos, 400 horas es entonces
1 - F(400)
.1353
GENERACION DE CONVERSIONES
7-6
277
(7-33)
218
u, = m
"
. I,;i
1,2,...
(7-34)
+ u , ( p - a ) ; 1 = 1 , 2 , ...
(7-35)
x, = y
+ 6(-ln
u,)*";
1 , 2 , . ..
(7-37)
7-7
Resumen
7.7 RESUMEN
7-6 GENERACIdN DE CONVERSIONES
219
N
1
N
\
CAPTULO 7 ALGUNAS
DISTRIBUCIONES
CONTINUAS
IMPORTANTES
220
7-8 Ejercicios
7-1
7-2
El precioporinauguracindedeterminadotipodemercancas
se distribuyede
manera uniforme en el intervalo [35$44f].
Cul es la probabilidad de que,en algn
y entre 40 y 42?
da, este precio sea menor a 40?
7-3
7-4
IJn corredor de bienes races carga comisin fija de $50 ms el 6 por ciento a las
ganancias de los propietarios. Si la ganancia se distribuye de modo uniforme cntrc
$0 y $2000, obtenga la distribucin de probabilidad de las remuneraciones totales
del corredor.
7-5
7-6
7-7
Muestre cmopuede utilizarse la funcin de densidad uniforme para generar variantes a partir de la siguiente distribucin de probabilidad emprica:
P(Y 1
__
.3
.3
.2
.4
.1
7-8
7-9
221
7-HJERCICIOS
/-
P { X < 2)
2
- P { X I 3)
3
r(f)= dx.
7-18 Demuestre las probabilidades de la funci6n gamma dadas por las ecuaciones 7-18 y
7-19.
'O
7-20 Una caja de caramelos contiene 24 barras. El tiempo entre pedidos por barra se
distribuye exponencialmente con media de 1O minutos. Cual es la probabilidad de
que una caja abierta a las 8:OO A.M. se haya terminado al medio da?
222
X<
=o
caso
en otro
=o
caso
en otro
a)
= 1
uniforme.
7-27 Demuestre que cuando 1 = 2, r = 1 o A = 1, r = 2 la distribucin beta se reduce a
7-8
223
EJERCICIOS
,,qz:
La densidad del tiempode
I
<K/c,
Captulo 8
Distribucin normal
8-1
Introduccin
8-2
Distribucinnormal
226
CAPTULO 8 DISTRIBUCIONNORMAL
I.(
Figura 8.1
Distribucinnormal.
= (x - p ) / c en
8-2
227
DlSTRlBUCldN NORMAL
La media de la distribucin
normal puede determinarse con facilidad. Puesto que
y si hacemos z = (x
- p ) / q obtenemos
E(X)=
~ s ; ; ( p uz)e2/2dz
-m
y dejando z
= (x
- p ) / o obtenemos
CAPITULO 8 DISTRIBUC16NNORMAL
228
=ayo
+ 11
por lo que
== e ( l P + o * r * / 2 )
(8-5 1
La funcin de distribucin F es
8-2
229
DISTRIBUCI6N NORMAL.
o
Figura 8.2
una funci6n bien tabulada. Una tabla de la integral en la ecuacin 8-8 se incluye
en la tabla I1 del apndice.
8-2.5 Procedimiento para la soluci6n de problemas
Elprocedimiento enlasolucidndeproblemaspriicticosqueimplicanla
evaluacidn de probabilidadesnormales acumulativas es en realidad muy simple.
Por ejemplo, supdngase que
X N( 100,4), y deseamos encontrar la probabilidad
de que X sea menor o igual que 104; esto es, P(X S 104) = F( 104). Puesto que
la variable aleatoria normal esthndar es
z=
x- P
-p
a
104 - 100
2
= 2
230
F( 104) = CP (2)
La tabla I1 del apndice contiene probabilidadesnormales estndar acumulativas
para diversos valores dez. De esta tabla, podemos leer
@(2) = .9772
Ntese que en la relacin z = (x - p ) / o , la variable z mide la desviacin de x
de la media p en unidades (o)de la desviacin estndar. Por ejemplo, en el caso
que acaba de considerarse, F(104) = @(2), lo cual indica que 104 corresponde a
dos desviaciones estndar (a = 2) sobre la media. En general, x = p + oz.En
lasolucindeproblemas,enocasionesnecesitamosutilizarlapropiedadde
simetra deq ademds de las tablas. Resulta til efectuar un bosquejo si hay alguna
confusi6n en la determinacin exacta de las probabilidades que se requieren,ya
que el rea bajo la curva y sobre el intervalo de inters es la probabilidad de que
la variable aleatoria se encontrar en el intervalo de inters.
Ejemplo 8.1 La resistencia al rompimiento (en newtons) de una tela sinttica,
denotada por X,se distribuye en N(800, 144). El comprador de la tela requiere
que sta tenga una resistencia depor lo menos 772 N . Se selecciona al azar y se
prueba una muestra de tela. Para encontrar P(X 2 772), calculamos primero
P ( X < 772)
( ;
X
p < 772
___
800
12
P( Z < - 2.33)
= @ (-2.33) = .O1
=
Figura 8.3
- N(800, 144).
8-2
DISTRIBUC16N NORMAL
231
125
P(X>125)=P
=
I2O)
P ( Z > 1.25)
1 - O(1.25)
1 - .8944
.lo56
As, dado un paro de la mdquina de empaque, el costo esperado es E(C) =
.1056( 10,000 + CRl)+ .8944(CR),donde C es el costo total y CRles el costo de
reparacin. En forma simplificada, E(C) = C,, + 1056.Supngasequela
administracin puede reducir la media de la distribucin del tiempo de servicio
a 115 minutos afiadiendo mds personal de mantenimiento. El nuevo costo de
reparacin ser6 CR2> CRl;sin embargo,
=
i
p = O
Figura 8.4
1.25
- N(120, 16).
232
125 - 115
=
1 - (P(2.5)
1 - .9938
.O062
P ( Z > 2.5)
CR,
O
- c.,) <
$994
P(.399
I
X I
.401)
.399 - .4008
.O004
S Z I
.4010.O004
- 4008
0.3990
0.4008 I
0.4010
Lmite
inferior
Lmite
superior
especificado
especificado
Figura 8.5
233
P(-4.5
zIS)
P( -2.5
cP(2.5) - @ (-2.5)
.9938 - .O062
.9876
I Z I +2.5)
Vemos que con los ajustes, 98.76 por ciento de los herrajes estarn dentro de la
tolerancia. La distribuci6n de los dihmetros de paso de mquina ajustados se
muestra en la figura 8.6.
Este ejemplo ilustra un importante concepto de ingeniera
de calidad. Operar
un proceso en la
dimensi6n nominal es porlo general mejorque operar el proceso
a otro nivel,si hay lmites de especificaci6n de dos extremos.
Ejemplo 8.4 Algunas veces surge otro tipo deproblemas relacionado con eluso
de las tablas de la distribuci6n normal. Considdrese, por ejemplo, queX N(50,
4). Adems sup6ngase quedeseamos determinar un valor de X,digamos x, tal que
P(X > x) = .025. Entonces,
Figura 8.6
234
por lo que
X
50
- 5
1.%
Y
x = 50
+ 2f1.96) = 53.92
Hay varios intervalos sim6tricos quese presentan con frecuencia. Sus probabilidades son:
+ 1 . 0 0 ~ =) .6826
P ( p - 1 . 6 4 5 ~I X I p + 1 . 6 4 5 ~ =
) .90
P ( p - 1 . 0 0 ~I X I p
+ 1 . 9 6 ~ =) .95
P ( p - 2 . 5 7 ~I X I P + 2 . 5 7 ~ )= .99
P(p- 3.00I
~ X Ip + 3.00~=
) .9978
P ( p - 1.960 I X I
p
x,+ x, + * - . +x,
(8-10)
entonces
(8-1 1)
Y
It
V ( Y ) = u;
u:
=
i=l
M,$)
. M,$)
. . - *. M,"(O
8-3
235
Figura 8.7
Ensamble de enlaces.
Por tanto,
M,.([)
e [ ( p , + p z + ..'
+p,,)r+(o:+o:+
.'
(8- 13)
t0,;')1~/21
X,
- N(12, .02)
X,
- N(24, .03)
X,- N(18..04)
Los enlaces son producidos por mquinas y operadores diferentes, por lo que
tenemos razn de supones que X , , X,y X , son independientes. Considrese que
deseamos determinar P(53.8 =S Y S 54.2). Puesto que Y = X,+ X, + X,, Y se
distribuye normalmente con media p y = 12 + 24 + I 8 = 54 y varianza o =
o: + o;+ o: = .O2 + .O3 + .O4 = .09. En consecuencia,
P(53.8 S Y
54.2)
53.8 - 54
a( .67)
- @ (- .67)
.749
.498
,251
=
=
<zi-~
54.2.3- j4
236
Estos resultados pueden generalizarse para combinaciones lineales de variables normales independientes. Las combinaciones lineales de la forma
u,
+ U I X , + . . . +U,,X,?
(8-14)
X,
- N ( l S O O , .0016)
X,
- N(1.480, .0009)
Por consiguiente,
PY = UlPl +
"2P2
(1)(1.500)
.o2
+ (-1)(1.480)
Y
u:
+ u;.;
.:u;
(1)2( .0016)
,0025
+ (-
1)*(.0009)
por lo que
=
.O5
P( Y
iO) =
a,(
.4)
~~~
Figura 8.8
Ensamble.
P Z <
.3446
~~~~~~~
.o5
237
Esto indica que 34.46 por cientode los intentos de ensamblaje tendrim falla. Si
librenominal py = .O2 es tan grande como
el disefiador considera que espacio
el
puede hacerse para el ensamble, entonces la nica manera de reducir la cifra de
34.46 por ciento es disminuir
la varianza delas distribuciones. En duchos casos,
esto puede conseguirse reacondicionando el equipo de produccii~n, mejorando
el
adiestramiento de los operadores, etcetera.
y -
CPr
(8- 15)
C1(4
lm --1
11-w
@(z)
(8-16)
Lascondicionesgeneralesmencionadas
en el teoremaseresumende
manera informal como sigue: Los terminos Xi, tomados de modo individual,
contribuyen con una cantidad insignificante a la varianza de la suma, y no es
probable que un solo termino contribuyade manera considerable a la suma.
La prueba de este teorema, asi comoun anhlisis riguroso de las suposiciones
necesarias, esthmhs allhdel alcance de esta presentaci6n.
Hay sin embargo varias
Y est6 aproximadamente
observaciones que deben hacerse. El hecho de que
distribuida en forma normal cuando los terminos Xi pueden tener en esencia
cualquier distribuci6n es la raz6n de soporte bhsico de la importancia de
la
distribuci6n normal.En numerosas aplicaciones,la variable aleatoria que se esth
CAP~TULO
8 DISTRIBUCI~
NORMAL
N
238
considerando puede representarse como la suma de n variables aleatorias independientes, algunas delas cuales pueden ser errores demedicin, otras deberse a
consideraciones fsicas, etc., y por ello la distribucin normal ofrece una buena
aproximacin.
Un caso especial del teoremacentral del lmite surge cuando cada una delas
componentes tienen la misma distribucin.
Teorema 8-2
Si X,,
X,,. . . , X, es una secuencia de n variables aleatorias independientes y
distribuidas identicamente con E ( X J = p y V ( X J = CT 2, y Y = X I X , + . . .
+ X,,entonces
(8- 17)
8-4
239
f(x 1
(b)
Figura 8.9
Ejemplo 8.7 Se empacan 250 piezas pequefias enuna caja. Los pesos de las
piezas son variables aleatorias independientes con media de .5 libras y desviaci6n
estndarde.10
libras. Se cargan 20 piezas enuna tarima. Sup6ngaseque
deseamos encontrar la probabilidad de que las piezas en la tarima excedan 2510
libras de peso. (DesprCciese tanto el peso de la tarima como de la caja.) Dejemos
que
x,+ x, +
' '
+ x,,,,,
CAPITULO 8
240
TABLA 8.1
DISTRIBUC16N NORMAL
ctividad
a Varianza
Media
Actividad
1
2
3
4
5
6
7
8
Varianza
12
15
2.7
3.2
4.6
2.1
3.6
7.1
1.5
1.o
1.3
1.o
1.2
.8
2.1
1.9
.5
1.2
9
10
11
.6
13
14
16
3.1
4.2
3.6
.5
2.1
1.5
1.2
2.8
.8
1.6
.2
.7
.4
.7
2500
Y
uy =
7.071
Por tanto
P ( Y > 2510)
P Z>
1 - O(1.41)
.O7929
25107.071
- 2500
49 semanas
0;
16 semanas
241
p y = 49 semanas
P(Y
I
y,)
.90
por lo que
p Z I ___
yo (
4 49
.90
Yo - 49
- 1.282
4
"
Y
y, = 49
=
+ 1.282(4)
54.128 semanas
.".
8-5
243
Con correcci6n
de continuidad
Cantidad deseada a p a w
de la distribuci6n binomial
P(X
P(X
I
x)
El terminos de la
funci6n de distribuci6n 0
x+
P(x-$IxIx+;)
x)
P(X I
x +
3 - np
x-$-np
3)
P(X< x)
=
P ( X I x - 1)
P(X2 -x)
P(XIx- 1
+ 3)
x-
3 - np
x+
+ - np
P ( X 2 x - +)
P( x > x )
=
P ( X 2 x + 1)
P(X2 x + 1
);
a-3-np
P(a I X I b)
P(a-:IXsb++)
P( X
15) = P(14.5 I
X I 15.5) = @
1 5 . , 4 20) -
= @ (- 1.13) -
h) P ( X < 1 5 ) = @
c)
2 0 ) = .1292
P( X < 18) = P( X
d) P(X222)=1-@
e)
17)
)=
.266
2 0 ) = .3541
P(19 < X
< 20)
20.5 - 20
18.5 - 20
a( - 1.38)
= .O45
20)
244
(8-22)
Pq
V( @ )= n
@ ( 5 ) - @ (-5)
= 1.0000
8-6
245
DISTRIBUC16N LOGNORMAL
8-6
Distribucin lognormal
La distribucin lognormal es la distribucih de una variable aleatoria cuyo logaritmo sigue la distribucin normal. Algunosprofesionales sostienen que la distribucin lognormal es tan fundamental como la distribucin normal. Ella surge de
la combinacin de trminos aleatoriosmediante un proceso multiplicativo.
La distribucin lognormal se ha aplicado en una amplia variedad de campos
entre los que se incluyen las ciencias fsicas, las biolgicas, las sociales y la
ingeniera. En las aplicaciones en esta ltima, la distribucin lognormal se ha
utilizado para describir el tiempo de falla en la ingeniera de confiabilidad y
el tiempo de reparacin en la ingeniera de mantenimiento.
8-6.1 Funcidn de densidad
Consideramos una variable aleatoriaXcon espacio del rango Rx = {x: O < x < m } ,
donde Y = In X se distribuyenormalmente con media puy varianza o;,esto es,
E(Y)=py
V ( Y ) =.f
=o
caso
en otro
(8-24)
Y
(8-26)
246
Modo
Media
Mediana
Figura 8.11
Distribucinlognormal.
8-6
DISTRIBUC16N LOGNORMAL
247
Y
p 4 = ( px)4( c12
(8-31)
donde c = (e":- 1). Estos momentos se aplican en dos medidas descriptivas. Estas
medidas son el coeficientedeusimetriu, C,, yel coeficiente de curtosis, C2
definidas como
[1 =
P3
-
(8-32)
0:
Y
(8-33)
El coeficiente de asimetra mide la desviacin con respecto a la simetra, y el
Coeficiente decurtosismideladesviaci6nde
la agudeza presentada por la
densidad normal. Para la distribucin lognormal
ll = c3 + 3c
(8-34)
(8-35)
<,
Es claro que > O indica asimetra positiva, lo cual es evidente de la grfica que
se muestra enla figura 8.1 l . Las distribucionesgamma y exponencial presentadas
en el captulo anterior tambitn tienen asimetra positiva. La curtosis ms grande
para la distribucin lognormal (C2 > O) indica la mayor agudeza que ocurre con
la distribucin normal.
8-6.4 Propiedades de la distribuci6n lognormal
q=
248
n
I1
X/"/
/=1
-\
respectivamente.
4. Si X, ( j = 1, 2, . . . , n) son variables lognormales independientes, cada
una con los mismos parmetros (,uuy,o;),entonces la media geomtrica
( fi
/=I
X J y
V ( X )=
=
el*(10)+41(e4 -
1)
e24(e4- 1) = 54.598e24
e6 = 403.43
Y
mediana
= el0 =
22.026
Para determinar una probabilidad especfica, por ejemplo P(X S lOOO), utilizamos la transformada y determinamos P(ln, X S In, 1000) = P(Y S In, 1000).
Los resultados son:
P ( Y 2 ln,1000)
P Z
lne1OO0
2 - lo
( - 1.55) = ,0606
Y,
In, X ,
- N(4,1)
- N(3,S )
- N(2,.4)
Y, = In, X , - N(1, . O l )
Y,
In, X ,
8-7 BlVARlADA
DISTRIBUC16N NORMAL
249
w = e l . 5 [ x2 Sx.Zx.7x3.1
1
Porlapropiedadreproductiva
parhmetros
1.5 + (2.5 . 4
con
+ .2 . 3 + .7 . 2 + 3.1 . 1) = 16.6
Y
[(2.5). 1
+ (.2).
.5
+ (.7)2. 4 + (3.1).
(.01)]
6.562
respectivamente. En otras palabras, ln,W N(16.6, 6.562). Si las especificaciones en W son, por ejemplo,20,000 a 600,000,podramos determinar la propiedad
de que est dentro delas especificaciones del modo siguiente:
~ ( 2 0 , 0 0 0I
w I 600 . 103)
@[
ln,600. l o 3 - 16.6
4526
@(.51) - @ (-2.69)
.6914
In, (600 . l o 3 ) ]
I-@(
In, 20,000
d526
16.6
.6950 - .O036
250
(8-37)
8-7
DISTRIBUC16NNORMALBlVARlADA
251
por lo que
E ( & ) = El1
E(X2)
= P2
v( x,) = (
7
;
v( x,) = u;
(8-41)
De tal modo
(712
P=
b l
(8-42)
(721
Y
v(x2lx1)
- P2)
(8-46)
252
NORMAL
8-7 DISTRIBUC16N
253
Y
(8-50)
[ X , , X , ] normal bivariada
( h ) p1 = .20 pulgada
p 2 = 1100 libras
u; = .O2 pulgada2
02 = 525 libras2
p = .9
La regresin de X,sobre X,es entonces
E ( X2lXl)
y la varianza es
Pz + P ( a * / d ( X , - PI)
( 1 4 6 . 7 ) ~+~1070.65
V(X2lXI) = 4 ( 1 - P)
=
525(.19)
99.75
AI estudiar estos resultados, el gerente de manufactura nota que puesto que p = .9,
esto es, cercano a 1, el dimetro de soldadura est altamente correlacionado con
P( X , 2 1080) = P
=
1 - @ (- 1.71)
.9564
254
6400
02
.25
p = .6
(2)
Y
el director calcula
1
Q --
.O013
lo cual predice que s610 hay una ligera esperanza de que la demanda del padre
sea vdlida.
255
6-10 EJERCICIOS
que X = p
a,por lo que las conversiones de X
N(p, o*)se obtienen
fhcilmente como x = p + m.
El mttodo directo requiere generar conversiones de nmeros aleatorios en
pares: u , y u*. Entonces
z1 = (-21n
u1)ll2
c0s(2su2)
z 2 = (-2111 ~ ~ ) ' / ~ s e n ( 2 s u ~ )
(8-51)
Z =
CU,-~
(8-52)
r=l
8-9 Resumen
Este captulo ha presentado la distribuci6n normal con diversos ejemplos de
aplicaciones. La distribuci6n normal, la normal estndar relacionada, y la lognormal son univariadas, en tanto que la normal bivariada presenta la densidad
conjunta de dosvariables aleatorias normalesrelacionadas.
La distribuci6n normal forma la base sobre la cual descansa una gran cantidad
del trabajo en la inferencia estadstica. La amplia aplicaci6n de la distribuci6n
normal la hace particularmenteimportante.
8-10 Ejercicios
8-1
256
e)
PAlZl
'1.5)
f ) Pz( - 1.9 I Z
8)
P;?(Z
h ) P,(lZl
I
2)
I 1.37)
I
2.57)
8-2
Sea X
8-3
En cada uno de los casos siguientes, determine el valor de c que hace verdadero el
enunciado de probabilidad.
8), PAX
12), PA2 S X
10).
a)
" ( c ) = 0.94062
b ) Pz( ( Z (Ic) = 0.95
C)
PZ(lZ1 5 C ) = 0.99
d ) P7(2 5 c ) = 0.05
8-4
Si PAZ
8-5
Si X
a)
b)
c)
d)
e)
8-6
8-7
8-8
La experiencia indica queel tiempo de reveladopara un papel deimpresin fotogrN(30 segundos, 1.21 segundos'). Determine: a) la
fica se distribuye como X
probabilidad de queX sea al menos 28.5 segundos, 6) la probabilidad de queX sea
a lo mhs 3 1 segundos, c) la probabilidad de que X difiera de su valor esperado en
mfls de 2 segundos.
8-9
6-10
EJERCICIOS
257
b)
c)
centmetros?
~ Q u valor
6
dedihmetro interior c tiene unaprobabilidad de ser excedido de.90?
Cul es la probabilidad de que el dimetro interior se encuentre entre 1 1.95 y
12.05?
7.0.
b)
8-14 El precio que se pide por cierto seguro se distribuye normalmente con media de
258
~ C u h es
l el valor dep que maximiza la utilidad esperada?
8-19 La dureza de Rockwell de una aleacin particular se distribuye normalmente con
media de 70 y desviaci6n esthndar de 4.
a) Si un espCcimen se acepta s610 si su dureza estil entre 62 y 72, jcuhl es la
6)
c)
8-20 Demuestre que E(Z,,) = O y V(Z,,) = 1, donde Z,, se define en el teorema 8-2.
/f
y V(X)= 0 2 / n .
dihmetro exteriorde
N(1.20, .0016) se inserta en un cojinetede
con N( 1.25, .0009). Determine la
manguito que tiene un dimetro interior (DI),
probabilidad deinterferencia.
donde XI
N(4, 3), X2
N(4, 4),
probabilidaddeque 15 C Y 20?
X3
- N(2,4)
y X,
- N(3,2).
iCuAl es la
6-10 EJERCICIOS
259
CUB1 es la
8-26 Un ciento de pequefos tornillos se empacan en una caja. Cada tomillo pesa 1 onza
con desviacih esthndar de.O1 onzas. Encuentre la probabilidad de que la caja pese
m& de 102 onzas.
8-27 Unamtiquinaautomhticaseempleaparallenarcajasconjabbnenpolvo.Las
especificaciones requieren que las cajas pesen entre11.8 y 12.2 onzas. Los nicos
datos disponibles acerca del rendimiento de la mhquina se refieren al contenido
1.9onzas
promedio de grupos de9 cajas. Se sabe que el contenido promedio es1de
l
s cajas producidas son
con desviacih esthdar de .O5 onzas. Que fracci6n dea
defectuosas? iD6nde debe localizarse la media para minimizar esta fracci6n defectuosa? Suponga que el peso se distribuye normalmente.
8-28 Un autobs viaja entre dos ciudades, pero visita ocho ciudades intermedias en
su
ruta. La media y ladesviacih esthndar de los tiempos de viaje son como sigue:
2-3
3-4
4-5
5-6
6-7
7-8
3
4
3
5
7
5
3
~ C u i ies
l la probabilidad de que el autobs complete
su jornada en32 horas?
8-29 Unprocesode
h ) P ( X = 15)
c)
P(12 S x I 20)
d ) P ( X = 14)
metodo aproximado.
CAPTULO
NORMAL8 DISTRlBUC16N
260
8-33 Si Z
8-35 Si Y = X iR/X$dondeXl
- N(4,1)
X, - N ( 3 , l )
In, X ,
yZ = In,
Y,
In, X ,
- N(2,.5)
e2X?Xi'X!28. Determine un conjunto de
P(L5 W <R)
8-39 Demuestre que la funcin
de densidad para
= .90
caso
=o
donde Y
In, X
otro
- N@, CT
2).
en
6-10 EJERCICIOS
261
Y,
(1
P2>
(X,)
y el dimetro del filamento
como una normal bivariada con los siguientes parmetros:
p , = 2000 horas
(X,)se distribuye
2500 horas2
o, =
.O1 pulgada2
.87
p2
83
0
;
25
a, =
16
p =
.8
bivariada.
a) Demuestre que y = constante corta la superficie de una elipse.
b) Demuestre que y = constante con p = O y o: = o $corta la superficie como un
crculo.
CAPITULO 8
262
DISTRIBUC16N NORMAL
R
donde X ,
/X:
+ X: + . . . +x,'
- N(0, o *) e independiente.
"2
8-47 Sean X
y=
libertad.
8-49 Sea X
Captulo 9
Muestras aleatorias
y distribuciones de muestre0
264
Definicin
X,,
X,,. . , X, es una muestra aleatoria de tamafio n si a ) las X son variables
Ejemplo 9.1 Supngase que deseamos tomar una muestra aleatoria de 5 lotes
de material sin procesar de 25 lotes disponibles. Podemos numerar los lotes con
los enteros del 1 al 25. Despus de esto se elige arbitrariamente de la tabla XV
del apndiceun rengln y una columna como punto de partida. Se lee hacia abajo
la columna elegida,la cual debetener 2 dgitos hasta que encuentran
se
5 nmeros
aceptables(unnmero aceptable se encuentra entre 1 y 25). Como ejemplo,
considrese que el proceso anteriorbrinda una secuencia de nmeros que se lee,
37, 48, 55, 02, 17, 61, 70, 43, 21, 82, 73,l3,60, 25. Los nmeros en negritas
especifican qu lotes del material sin procesar se van a elegir como la muestra
aleatoria.
9-2
9-2
265
una estadstica es unafuncin de los datos a partir de una muestra aleatoria, ella
mismaestambien una variable aleatoria. Esto es, si tomamos dos muestras
aleatorias diferentes de una poblacin y calculamos la media de la muestra,
debemos esperar que sean diferentes los valores observados de las medias de
muestra Xl y X2.
El proceso de extraer conclusiones en tomo a poblacionescon base en datos
de muestras utiliza en forma considerable las estadsticas. Los procedimientos
requieren que entendamos el comportamiento probabilistic0 de ciertas estadsticas. En general, llamamosdistribucin de muestre0 a la distribucin deproba-bilidad de una estadstica. Hay varias distribuciones de muestreo importantes que
se utilizarn de manera extensiva en captulos subsecuentes. En esta seccin,
definimos e ilustramos brevemente estas distribuciones de muestreo.
Considerese la determinacin de la distribucin de muestreo de la media de
muestra
Supngase que una muestra aleatoria de tamao n se toma de una
poblacin normal con media ,u y varianza O . Cada observacin en esta muestra
aleatoria es una variable aleatoria distribuida normal e independientemente con
media y y varianza O . En consecuencia, la propiedad reproductiva de la distribucin normal (ver seccin 8-3) implica que la distribucin muestral de sea
normal, con media ,u y varianza O /n. Adems, si la poblacin de la distribucin
esdesconocida, el teorema central del lmite (seccin 8-4) implica que para
muestras de moderadas a grandes, la distribucin muestral de
es aproximadamente normal, con media p y varianza O In. Por tanto, se concluye que si es
la media de
una muestra aleatoria detamao n tomada de una poblacin con media
,u y varianza O ,entonces la distribucin muestral de es normal con media ,u
y varianza O In, si la poblacin est distribuidanormalmente. La distribucin de
ser aproximadamente normal aun si la poblacin tiene una distribucin no
normal, si las condiciones del teorema central del lmite se cumplen.
x.
x,
Definicin
El error estndar de una estadstica es la desviacin estndar de su distribucin
muestral. Si el error estndar involucra parmetros desconocidos cuyos valores
pueden evaluarse, la sustitucin de stos, en el error estndar se convierte en un
error estndar estimado. Para ilustrar esta definicin, supngase que se est
muestreando de una distribucin normal, con media ,u y varianza O. Ahora, si
la distribucin
es normal con media ,u y varianza 0 2 / n , entonces el error
estndar de es
di
Si no se conoce O, pero se sustituye la desviacin estndar S en la ecuacin
anterior, entonces el error estndar estimado de es
MUESTRAS
ALEATORIAS
266
Y DISTRIBUCIONES
MUESTRE0
DE
Ejemplo 9.2 En su libro Design and Analysis of Experiments, 2a. edicin (John
Wiley & Sons, 1982), D. C. Montgomery presenta datos sobre la resistencia de
la cohesin portensin de un mortero de cementoportland modificado. Las diez
observaciones son como sigue:
16.85,16.40,17.21,16.35,16.52,17.04,16.96,17.15,16.59,16.57
donde la resistencia de lacohesin por tensidn se mide en unidades dekgf/cm2.
Montgomery supone que la resistencia de la cohesin por tensidn se describe de
manera adecuada por ladistribucin normal. El promedio de la muestra es
X = 16.76 kgf/cm2
Supngase que sabemos (o que estamos dispuestos a suponer) quela desviacin
estndar de la resistencia decohesin
la
por tensin es CT = .25 kgf/cm2. Entonces,
el error estndar del promedio de la muestra es
o/&
0 . 2 5 / m = 0.079 kgf/cm'
9-3
0.316/m
0.0999 kgf/cm2
Distribucin ji cuadrada
Teorema 9-1
Sea Z,, Z,, . . . ,Z, variables aleatorias distribuidasnormal e independientemente,
con media p = O o varianza CT = l . Entonces la variable aleatoria
9-3
267
DlSTRlBUCldN JI CUADRADA
= o caso
otro
en
(9-2)
y se dice que sigue la distribucidn
ji cuadrada con k grados de libertad, en forma
abreviada
Para la prueba del teorema9-1, vkanse los ejercicios 8-47 y 8-48.
La media y la varianza de la distribucidn$ son
x:
p = k
(9-3)
o 2 = 2k
(9-4)
2.
268
2,de la
Esto es, el punto del 5 por ciento de laji cuadrada con I O grados de libertad es
x20s,,o= 18.3 1.
,y + x:
1
+ ...
+x2
9-3
269
DISTRIBUC16N JI CUADRADA
P
k = Ck,
,=1
x!
Por tanto,
P
y =
k,
Cxf= c cz,:
r=l
/=1,=1
x;
y puesto que todas las variables aleatorias Z , son independientes por que las
son independientes Y esjustamente la suma de los cuadrados de K =
,k,
variables aleatorias normales esthndar. Del teorema 9- 1, resulta que Y es una variable aleatoria ji cuadrada con k grados de libertad.
Ejemplo 9.3 Como ejemplode una estadstica que sigue la distribucin ji
cuadrada, supngaseque X,,
X,,. . . ,X,,es una muestra aleatoria de una poblacin
normal, con media p y varianza o '. La funcin de la varianza de la muestra
(. - 1js2
o2
x;-
se distribuye como
,. Utilizaremos esta estadstica en los captulos 10 y 11.
Veremos en esos captulos que debido a que la distribucin del muestreo de esta
estadstica es ji cuadrada, podemos construir estimaciones de intervalos de
confianzaehiptesis estadsticas de prueba alrededor de la varianza de una
poblacin normal.
Para ilustrar eursticamente por qu la distribucin de muestreo de la estadstica en el ejemplo 9.3, ( n - 1)s' / o 2es, ji cuadrada, ntese que
( n - 1)s'
(x,
- q
,=I
(9-5)
270
es xi, debido a que cada termino (X. - p)/o es una variable aleatoria normal
estndar independiente. Considhrese ahora
( x ;- p ) 2 =
i=l
P)lZ
r=l
i = l i= 1
p):
+2(X-
p)
i( x ,
X)
i=l
e ( x ; - ~ ) ~ + n ( 2~ - , p )
r=l
Por tanto,
x
(x
Puesto que
est normalmente distribuida con media p y varianza 0 2 / n , la
cantidad
- p)/(o */n)esta distribuida comox:. AdemBs, puede demostrarse
que las variables aleatorias y S son independientes. Por tanto, puesto que
Cy=,(Xi - ~ ) ~est
/ odistribuida como xi, parece lgico utilizar la propiedad
de aditividad de laj i cuadrada (teorema 9-2), y concluir que la distribucin
de ( n - 1)S/02es x;-,.
9-4
Distribucin t
Teorema 9-3
9-4
DISTRIBUC16N 1
274
y se afirma que sigue la distribuci6n t con k grados de libertad, lo que se abrevia tk.
Prueba Puesto que Z y V son independientes su funci6n de densidad conjunta
es
t= -
Y
u=u
son
z
tg
Y
u=u
El jacobiano es
Por consiguiente,
IJI
Y
272
Debido principalmente a la costumbre histrica, muchos autores no distinguen entre la variable aleatoria T y t . La media y la varianza de la distribucint
son p = O y o 2 = k/(k - 2) para k > 2, respectivamente. En la figura 9.3 se
presentan varias distribuciones t. La apariencia general de la distribucin t es
similar a ladistribucinnormalestndar,
en queambasdistribucionesson
simktricas y unimodales, y el valor de la ordenada mxima se alcanza cuando p
= O. Sin embargo, la distribucin t tiene colas ms pesadas que la normal; esto
es, tiene mayor probabilidadhacia afuera. Cuando el nmero de grados de libertad
k
00, la forma lmite de la distribucin
t es la distribucin normal estndar. Al
visualizar la distribucint a veces es til saber que la ordenada de la densidad en
la media p = O es aproximadamente 4 6 5 veces m8s grande que la ordenada en
los percentiles quinto y noventa y cincoavo. Por ejemplo, con '10 grados de
O
Figura 9.3
Varias distribuciones f.
9-4
273
DISTRIBUC16N t
ti-a, k =
pro(,
porcentuales de la distribucidn t.
libertad para t esta raz6n es 4.8, con 20 grados de libertad este factor
es 4.3, y con
30 grados de libertad este factor es 4.1. En comparaci6n, para la distribuci6n
normal, este factor es 3.9.
Los puntos de porcentaje de la distribuci6n t e s t h dados en la tabla IV del
apCndice. Sea t , k el punto porcentual o valor de la variable t con k grados de
libertad tal que
Este punto porcentual se ilustra en la figura 9.4. N6tese que puesto que la
distribucin t es simtrica con respecto a cero, podemos encontrar que
t4-a,t =
- t , k. Estarelaci6nestil,puestoquelatabla
IV brinda s610 los puntos
porcentuales de lacola superior; esto es,valores de t, k para a 6 SO. Para ilustrar
el empleo de la tabla, n6tese que
P{ r 2
t,o,,,,}
P{ t 2 1.813)
.O5
10
= -1.813.
Ejemplo 9.4 Como un ejemplo de una variable aleatoria que sigue la distribuci6n t, sup6ngase que X,, X,, . . . ,X, es una muestra aleatoria deuna distribuci6n
normal con media p y varianza o ,, y sean y S * la media y la varianza de la
muestra. Considrese la estadstica
274
obtenemos
./fi
F - p
z - p
-__
-
"
S / M )
{ S F
(9-10)
9-5 Distribucin F
Una distribucin de muestre0 muy til es la distribucin F.
Teorema 9-4
Sean W y Y variables aleatorias ji cuadrada independientes con u y v grados de
libertad respectivamente. Entonces el cociente
w/u
F= y/u
tiene la funci6n de densidad de
probabilidad
9-5
275
DlSTRlBUCldN F
umf
u
Y
y=m
En consecuencia,
4f (m)
d f ?m > =
m(u/2)-1
u u
y puesto que h ( f ) =
h(f)
( 4 2 )-1
e-(m/2)((u/u)f+l)
Q<f,m<ao
rg(J m) dm,obtenemos
(U+U)/2
o <f<
0O
2uyu
+ u - 2)
u ( u - 2)(u - 4)
u > 4
276
Figura 9.5
La distribucibn F.
centradaalrededorde
1 ylos dos parhmetros u y 'v le proporcionan mayor
flexibilidad en cuanto a l a forma.
Los puntos porcentuales dela distribucih F se dan en la tabla V del apkndice.
Sea Fa, ~, el punto porcentual de la distribucibn F, con u y v grados de libertad,
tal que la probabilidad de quela variable aleatoria F exceda este valor es
y
9-6
277
RESUMEN
(9-1 2)
F.95,5,10 = ___
' . O s , 10.5
- - .217
4.74
9-6 Resumen
Este captuloha presentado el concepto de
m;estreo aleatorio y las distribuciones
de muestreo. En el muestreo repetido a partir de una poblaci6n, las estadsticas
de muestra.de1 tipo analizado en el captulo 2 varan de una muestra a otra, y la
distribuci6n deprobabilidad de tales estadsticas(o funciones delas estadsticas)
se llaman distribuciones demuestreo. Las distribucionesnormal, ji cuadrada, t de
MUESTRAS
ALEATORIAS
278
Y DISTRIBUCIONES DE MUESTRE0
9-7
Ejercicios
9- 1
9-2
9-3
9-4
.( i:
9-8
9-7
EJERCICIOS
279
Considereelpro_blemade
estndar de X , -X, .
los resistoresen
el ejercicio9-8.
Encuentre el error
&, respectivamente.
dosgobla_ciones normales con medias pl y p , y varianzas y
Si X, y X, son las medias de muestra, encuentre la distribucin de muestreo de la
estadstica
d.
de d. Obtenga ademsel error estndar estimado de
X,,,,,
donde X(,)es el elemento de la muestra ms pequeAo (X(,)
= mn {X,,
X,, . . . ,
X,,}) y X(,,)
el elemento dela muestra ms grande (X(,,)
= mx {X,,
X*, . . . ,X,,}).
X(i)
280
1 - [1 - F(t)l"
FX[",W =
[W
l"
LJd
4 1-
F(Ol""f(4
P( X(,,) = 1)
1 - (1
o)
1 - p"
P(
x(,,
p)"
. . . ,Xfluna
muestra aleatoria de
una variable aleatoriacontinua. Encuentre
E[F(X,J]
Y
xfs5.x
b)
XZso.12
201
9-7 EJERCICIOS
c,
d)
2
x.025.20
xf,
talque
P ( X : I~
xf.,,}
.975
t.025,
I0
b,
c)
= .95
F25.4.9
b,
F.05. 15.10
c)
F95.6.8
d , F90.24.74
9-26 Sea F1 - a ,,,
l/Fa
v.
v.
Demuestre
Captulo 10
Estimacin de parmetros
284
x.
,y=
2.5
2.85
o 2.
Los problemasde estimacin ocurren con frecuencia en ingeniera. A menudo
necesitamos estimar
la media y de una sola poblacin
la varianza o (o desviacin estndar de o)de una sola poblaci6n
la proporcinp de artculos en una poblacin que pertenecen a la clase de
inters
la diferencia en las medias de dos poblaciones, yl - y2
la diferencia en dos proporciones de poblacin, p, - p 2
Estimaciones puntuales razonables de estos parmetrosson las siguientes:
x,
para p , la estimacin es fi =
la media de 1a.muestra
para 02,la estimacin es h2= 9, la varianza de la muestra
parap, la estimacin es j = Xin,la proporcin de la muestra, donde X es
el nmero de objetos en una muestra aleatoria de tamao n que pertenece
a la clase de inters
para yl - p2,la estimacin es f i , - A = X , - X 2 , la diferencia entre las
medias de las muestra de dos muestras aleatorias independientes
parap, - p z , la estimacin es b, -t2,
la diferencia entre dos proporciones
de muestra calculadas a partir de dos muestras aleatorias independientes
"
285
E(8) = 8
(10-1)
Esto es, 8 es un estimador neutral de @sien promedio sus valores son iguales
a 8. Ntese que esto equivale a requerir que la media de la distribucin de la
muestra de 8 sea igual a 8.
Ejemplo 10.1 Supngase queXes una variable aleatoria con mediap y varianza
. . . ,X,, una muestra aleatoria detamafio n de X . Demustrese que
la media de muestra y la varianza de muestra S son estimadores neutrales de
p y CT ,, respectivamente. Considrese
CT ,. Sea X , , X,,
1
-E
r=l
1,2,
X,
. . . , n,
286
1
-E
n-1
( X f-
1
-E
n-1
x)
,=I
n
;=I
(X,
+ 3- 2 X X f )
+ o y E(k2)=
,u2
+ 0 2 / n ,tenemos
= 0
ECM(~=
) E@-
e)
(10-2)
~ ( 4 1 + [e
E[&-
~ ( d+) (sesgo)2
E(@]
(10-3)
207
B-
ECM( X )
ECM(X,)
02/n
"-
1
"
u2
e,
e,,
Y %.
e,
288
de des'
1
v(6)2
( 10-4)
V( X) 2
nE
[ 'xi'1
1
10-1
209
el
e,,
(10-5)
--$
290
10-1.2
=o
caso otro
x =
O,]
en
Luego
dP
P
Al igualar esto a cero y resolver con respecto de p se obtiene el estimador de
mxima similitud, p, como
291
Luego
;-
ix,
i=l
-x
-
n
como el estimador demxima similitud de p.
Puede suceder que no siempre sea posible utilizar mtodos del clculo para
determinar el mximo de L(8). Esto se ilustra enel siguiente ejemplo.
Ntese que la pendiente de esta funcinno es cero en todas partes, por loque no
podemos utilizar mtodos de clculo para encontrar el estimador de
mdxima
similitud ir. Sin embargo, ntese que la funcin de probabilidad aumenta cuando
a disminuye.Portanto,
maximizaramos L(a) fijando CI como el valor ms
pequefio que podra suponerseen forma razonable. Por supuesto,a no puede ser
ms pequefia que el valor ms grande de la muestra, de modo que usaramos la
observacin ms grande como ir.
El mtodo de mxima similitud puede emplearse en situaciones enlas que se
requiere estimar varios parmetros desconocidos, por ejemplo 01, O,, . . . , 6,. En
tales casos, la funcin de probabilidades una funcin de los k pardmetros
desconocidos O,, e,, . . . , 8, ylosestimadoresdemximasimilitud
{ $ } se
292
Luego
Y
1
62 = -
1 ( x ,- X )
r=l
293
x;
m;-
r=l
1 , 2 , ..., k
(10-7)
O,,
-m
t = 1 , 2 , . . ., k
.x- E
Rx
. . . ,e,) dx
X continua
t = 1 , 2 , . . . , k ,discreta
X
(10-8)
Los momentos {p',}de la poblacidn serhn, en general, funciones de losk parhmetros desconocidos {O,}. AI igualar los momentos de muestra y los momentos de
poblacidn se producirhn k ecuaciones simulthneas en k incdgnitas (los { Oi}); esto
es,
p:
mi
1 , 2 , ..., k
e,, 4, . . . ,
(10-9)
ek
294
distribucin normal
Pi
p;
= 0 2
c1
+ p2
Los momentos de lamuestra son m', = (l/n) C y= ,Xi y m', = (l/n)T: y=,
ecuacin 10-9 obtenemos
x.De la
1 "
p=-"'q
r=l
Of&=
a
2
x.Por consiguiente,
6=2X
o el estimador del momento de a es exactamente el doble de la
muestra.
media de la
10-1
ESTIMAC16NPOR PUNTOS
295
Cuando presentamos el valor de una estimacin puntual, suele ser necesario dar
alguna idea de su precisin.
El error estndar es lamedida usual de precisin que
se emplea.Si des un estimador de0, entonces elerror estndar de des justamente
la desviacin estndar ded, o
%=
vv(e)
(10-10)
Si CT;involucra cualesquiera parmetros desconocidos, entonces si sustituimos estimaciones de estos parhmetros en la ecuacin 10-10, obtenemos el error
estndar estimado de 4, digamos 86. Un error estndar peque0 implica que se
ha presentado una estimacin relativamente precisa.
Ejemplo 10.9 Un artculo en el Journal of Heat Transfer (Trans. ASME, Ses.
C, 96, 1974,p. 59) describe un nuevo mtodo para
medir la conductividad trmica
de hierro Armco.AI emplear una temperatura de100F y una entrada de potencia
de 550 W, se obtuvieron las siguientes 10 mediciones de conductividad trmica
(en Btu/hr -pie - OF):
41.60,41.48,42.34,41.95,41.86
42.18,41.72,42.26,41.81,42.04
Una estimacin
por
puntos
de
la
es la media de la muestrao
X = 41.924 Btu/hr
- ft -
y 550 W
O F
0.284
& - = - = -- 0.0898
296
P(L<B<U}=l-a
(10-11)
El intervalo resultante
L r B s U
(10-12)
de un
CONFIANZA
297
x).
L l 6
(10-13 )
(10-14)
De manera similar, un intervalo de confianza superior de 100( 1 - a)por ciento
de un lado en 8 est dado por el intervalo
6s u
(10-15)
(10-16)
"~
"
"1 1 1 -
L
l
"
"
"
"
ESTlMACldN
CAPTULO 10
298
DE PARAMETROS
x.
z=x - P
~
a/&
(x
P{ -z,,
z za,z}= 1 - a
I I
Figura 10.4
La distribucin d e Z.
299
x - 2,,,0/Jt; I I* x + za/p/&
S
(10-18)
,',
'
x - Za/20/J;;
41.924 - 1.96(0 . l O ) / m
=w"
41.924 - O.O@
= 41.862
y el lmite de confianza superior,
=
u=x + Zo/,0/6
+ 1.96(0.1O)/m
= 41.924 + 0.062
=
41.924
41.986
Por consiguiente el lmite de confianza dedos lados del 95 por ciento es
=
41.862 -< p
41.986
300
2( 1.96a/G)
3.92a/G
5.l5a/&
( -] [
Za,2a
E
(1.96)O.lO
o.05
15.37
16
301
E = error =
IX - p I
H
I
L = Jc - z,/
X
I
O l J
I
u = x + Z,/,
Olfi
Considrense dos variables aleatorias independientes X,con media pIdesconocida y varianza o: conocida y X, con media pzy varianza o: desconocidas.
Deseamos encontrar un intervalo de confianza del lOO(1 - a) por ciento en la
diferencia de las medias - ,u2. Sea X,,, XI2,. . . ,X,,,
una muestra aleatoria de
n, observaciones de X,;y X 2 , , XZ2,. . . ,
una muestra aleatoriade n2
observaciones de X,.Si
y
son las medias de las muestras, la estadstica
,u,
x,
Z=
x
1 - 2 2 -
(11.1 - P 2 )
302
(10-23)
(10-24)
( 10F25)
Ejemplo 10.11 Se efectuaron pruebas de resistencia a la tensin en dos clases
diferentes de largueros de aluminio empleados en la manufactura del ala de u n
avin detransportecomercial.
De laexperiencia pasada con el proceso de
303
Clase
Tamano
de
larguero
1
2
X,
n, = 10
n2 = 12
Desviaci6n
estandar
1.0
02 = 1.5
= 87.6
O,
x2 = 74.5
12
= 13.1 - 0.88
=
12.22 kg/mm2
= 13.1
+ 0.88
= 13.98
kg/mm2
Tenernos una confianza del 90 por ciento de que la resistencia a latensi6n media
del aluminio de grado 1 excede a la del aluminio de grado 2 entre 12.22 y 13.98
kg/mm2.
304
-x
(10-26)
Recudrdese redondear hacia arribasi n no es un entero.
5,
S/&
305
(x
La distribuci6n de t =
- p ) / ( S / f i )se muestra en la figura 10.6. Al dejar
que td2, - sea el punto porcentual superior cr/2 de la distribuci6n t con n - 1
grados de libertad, observamos de la figura 10.6 que
x - L/2,n-1s/fiI p I x + t a p , n-ls/d
(10-28)
x - ta.n-lS/d
Ip
(10-29)
x + ta,n-lS/fi
(10-30)
Recurdesequeestosprocedimientos
suponen queestamosrealizando el
muestre0 en una poblaci6n normal. Esta suposici6n es importante paramuestras
pequeas. Por fortuna, la suposici6n de normalidad se cumple en muchas situaciones prcticas. Cuandoese no es elcaso,debemosutilizarintervalos
de
confianza dedistribucin libre o no paramtricos. Los mtodos no paramtricos
se estudian en el captulo 16. Sin embargo, cuando la poblacidn es normal, los
306
9.99, 9.88
9.8475
0.0954
x - t0,2,n-IS/JS;
9.8415 - 2.093(0.0954)/m
= 9 .go29 seg
u = x + t a p ,n- 1
= 9.8475 + 2.093(0.0954)/m
S / h
9.8921 seg
Por tanto, el intervalo de confianza del 95por ciento es
=
p I
9.8921 seg
9.8029 seg I
307
S;
( n , - qs;
=
n,
+ ( n 2 - 1)s;
+ n2 - 2
(10-31)
Para desarrollar el intervalo de confianza parap1-A, ndtese que ladistribuci6n dela estadistica
t=
x, -
22 -
(PI - P 2 )
300
xl
x2
309
( n , - 1)s;
S;
n,
+ ( n 2 - 1)s;
+ n2 - 2
(?./?!
Ladesviacinesthndarcombinadaes
sp =
= .923.Puestoque
t*.,,, + n2-2 - t,025,25
= 2.060, podemos calcular los lmites de confianza inferior y
superior del 95 por ciento como
1.76 min
24.6 - 22.1
+ 2.060 (0.925)
c-z
-
+-
= 3.24 min
Esto es,el intervalo deconfianza del 95 por ciento en la diferencia
en los tiempos
medios de inmersi6nes
1.76 min I p1 - p 2 I
3.24 min
Estamos 95 por ciento seguros de que
el catalizador 1 requiere un tiempo de
inmersin que esth entre 1.76 minutos y 3.24 minutos m& largo que el requerido
por el catalizador 2.
En muchas situaciones no es razonable suponer que o: = o:.Cuando esta
suposicin es injustificada, an sera posible encontrarun intervalo de confianza
de 100( 1 - a)por ciento en p , - empleando el hecho de que la estadstica
t* =
x1
- x 2 - (P1 -
P2)
& / n , + S,"/.,
se distribuye aproximadamente como t con grados de libertad dados por
Y =
(S:/.,
( W n d 2
n, + 1
+ s2!/n2)2
+
n,
+1
-2
(10-36)
310
(10-37)
Loslmitesdeconfianzade
un ladosuperior(inferior)
pueden encontrarse
reemplazando el lmite de confianza
inferior (superior) con --(m) y cambiando
cz/2 por a.
10-2.5 Intervalo de confianza sobre p, -& para observaciones en pares
En las secciones 10-2.2 y 10-2.4 desarrollamos intervalos de Confianza para la
diferencia en las medias en el caso en el que se seleccionaban dos muestras
aleatorias independientes de las dos poblaciones de inter&. Esto es, n, observacionesseseleccionaronalazarde
la primera poblacidn y una muestrapor
completo independiente de n2 observaciones se seleccion6 al azar de la segunda
poblaci6n.Sonnumerosas
las situacionesexperimentales donde s610 hay n
unidades experimentales diferentes y los datos se colectan en pares; esto es, se
hacen dos observaciones en cada unidad.
Por ejemplo, la revista Human Factors (1962, p. 375-380) informa sobre un
estudio en el que a
14 sujetos se les pidi6 que estacionaran dos autom6viles
teniendo distancias entre ejes y radios de giro bastante diferentes. Se registr6 el
tiempo en segundos para cada auto y sujeto,y los datos resultantes se presentan
en la tabla 10.2. AdviCrtase que cada sujeto es la unidad experimental que se
mencion6 antes. Deseamos obtener un intervalode confianza respectoa la
diferencia en el tiempo medio p, - b para estacionar losdos autos.
Engeneral,sup6ngase
que los datosconstande n pares (X,,,
XZJ,(X,,,
X,,), . . . ,(X,,, SeX,,,),
suponeque tanto X,como X, se distribuyen normalmente
con mediap, y pz,respectivamente,
Las variables aleatorias dentro de pares diferentes son independientes. Sin
embargo, debido a quehay dos mediciones en la misma unidad experimental, las
dos mediciones dentro del mismopar pueden no ser independientes.ConsidCrense las n diferencias D I= X , , - X 2 , , D2 = X,,-Xz2, . . . , D, = X,,, -Xz,. En estas
condiciones la media delas diferencias D,digamos p ~es,
p0
E(D)
E ( x,-
x,)= E ( X , )
E(X,)
p1 - p 2
ANZA
DE
INTERVALO
10-2 ESTIMAC16N
DEL
24.4
21.2
36.2
29.8
311
~~
Autom6vil
Sujeto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
19.2 37.0
5.6
25.8
16.2
24.2
0.6
22.0
33.4
7.0
23.8
26.0 58.2
5.8
33.6
1.2
23.4
0.6
4.0
2
17.8
20.2
16.8
41.4
21.4
38.4
16.8
32.2
27.8
23.2
29.6
20.6
32.2
53.8
Diferencia
- 0.6
-
17.2
- 5.0
- 6.2
- 24.0
D-
'a/2,n-IsD/fi
'
ta/2,n-1
PD
S D/ h i
(10-38)
'
- t.05.13Sd/~
1.21 - 1.771(12.68)/m S
-
4.79 I
E".D I
d+
I 1.21
/.LD I
t.05,13sd/fi
+ 1.771(12.68)/J14
7.21
312
x:-,.
( n - 1)s2
U2
(n
1)P
XX
1 -aa/ /22. , n - 1
< u
( n - 1)S2
I
= I - a
(10-39)
10-2
313
X1-a/2,n-l
2
Xap.n-1
( n - 1)s2
< a 2 1
(10-40)
i
(10-41)
El intervalo de confianza superior del lOO(1
, ~ x:--.,dejando L = O y sustituyendo x : - ~ ~ con
- a) por ciento se
encuentrh
( n - I)s2
2
x95.19
(19) .O225
u2 I
Por tanto, en el nivel de confianza del 95 por ciento, los datos no soportan el
requerimiento de que la desviaci6n estndar del proceso sea menor de .20 onzas
lquidas.
314
5':
Por consiguiente
F,
-a,2 n2
Figura 10.8
I,n,-l
Fa,?
n2-1 2 2 - 1
La distribuci6n de Fn2-,,",-
315
(10-45)
Fa/2,nl-*,n2-l
(10-46)
en tanto que un intervalo de confianza superior del 100( 1 - a) por ciento en
o ;/o$
es
(10-47)
Ejemplo 10.16 Considrese el proceso de grabado por bafio qumico descrito
en el ejemplo 10.13. Recuerdese que se estn comparando los dos catalizadores
para medir su eficacia en lareduccin de los tiempos de inmersi6n para tarjetas
de circuito impreso. n, = 12 baAos se efectuaron con el catalizador 1 y n2 = 15
bafios se realizaron con el catalizador 2, resultando S , = .S5 minutos y s2 = .98
minutos. Determinaremos un intervalo de confianza de90 por ciento respecto al
cociente de varianza o:/o:. De la ecuaci6n 10-44, encontramos que
(0.85)*
(0.98)'
0.39 I
u:
-
<
(0.85)2
___ 2.74
- (0.98)2
0
2
"
01'
0.29
- < 2.06
02' -
316
desviaciones estndarde los tiempos deinmersin para los dos catalizadores sean
diferentes en el nivel de confianza del90 por ciento.
10-2.8 Intervalo de confianza sobre unaproporci6n
A menudo es necesario construir un intervalo de confianza del loo( 1 - a) por
ciento en una proporcin. Por ejemplo, supngase que se ha tomado una muestra aleatoria de tamafio n de una gran poblacin (posiblemente infinita), y que
X(< n ) observaciones en esta muestra pertenecen ala clase de inter&. Entonces
j = X / n es el estimador puntual dela proporcin de la poblacin que pertenece a
esta clase. Ntese que n y p son los parmetros de la distribucin binomial.
Adems, en la seccin 8-5 vimos que la distribucin de muestre0 dei, es aproximadamente normal con mediap y varianza p( 1 - p)/n,si p no est demasiado cercade
O 1, y si n es relativamente grande. De tal modo, la distribucin de
J
iP
z=
P { -Za,* 2
zI
za,2}=
- (Y
j -
z,,,
/-
5 p 5 i,
+ Z,,,?
1 -
(Y
(10-49)
10-2 ESTlMACldN
INTERVALO
DEL
DE CONFIANZA
317
y el intervalo de confianza de dos lados del 100( 1 -a) por ciento aproximadoen
P es
( 10-52)
.16 - 1.96/?
I p I .16
+ 1.96
la cual se simplifica a
.O8
.24
318
p,
10-2 E S T I M A C I ~ N
DEL INTERVALO DE CONFIANZA
319
-$2-
PI(] - P I )
( P I -P2)
Pr(l
- P2)
se distribuye aproximadamente en forma normal estndar. AI emplear un planteamiento anlogo al de la seccin previa, resulta que un intervalo de confianza
de dos ladosdel 100(1 - a) por ciento aproximado para p I-p2 es
320
\i
.161;84)
~
.12( .88)
~
85
Esto se simplifica a
Este intervalo incluye el cero, de modo que, con base en los datos de la muestra,
parece poco probable que los cambios realizadosen el proceso de acabadode la
superficie hayan reducido la proporcin de los ejes de rbol defectuosos que se
estn produciendo.
x.
321
x'
(1
-x)'
-2
(1 - p ) '
x(l - x )
P O -P)
E(X) = p y E ( Y ) = p . Por
En consecuencia, sustituyendo p en V( p) por p, el intervalo de confianza aproximado del 100( 1 - a) por ciento para p se encuentra a partir de la ecuacin 10-57
como
322
c"
323
324
simultneamente
correctos}
=1
2 1
- (Y
_,i).;
1>1
(10-58)
10-3 Resumen
Este captulo ha presentado las estimaciones por puntos y de intervalo de parmetros desconocidos. Se estudiaron dos mtodos para obtener estimadores puntuales: el mtodo de mxima similitud y el mtodo de momentos. El mtodo de
mximasimilitudsuelellevara
estimadores que tienen buenas propiedades
estadsticas. Se obtuvieron intervalos de confianza para una diversidad deproblemas de estimacin de parmetros. Estos intervalos tienen una interpretacin de
frecuencia. Los intervalos de confianza de dos lados desarrollados en la seccin
10-2 se resumen en la tabla 10-3. En algunos casos, los intervalos de confianza
de un lado pueden ser apropiados. stos pueden obtenerse dejando un lmite de
confianza en el intervalo de confianza de dos lados igual al lmite inferior (o
superior) deuna regin factible para el parmetro, y empleando a en lugar de al2
como el nivel de probabilidad en el lmite de confianza superior (o inferior)
restante. Se presentaron tambin de manera breve los intervalos de confianza
aproximados en la estimacin de mxima similitud y los intervalos de confianza simultneos.
10-4 Ejercicios
10-1 Supngase que tenemos una muestra aleatoria de tamaiio 2n de una poblacin
denotada por X , y E(X) = p y V(X) = O . Sean
1
2n
I7
10-4
325
EJERCICIOS
e,
d2 =
x , + x, + . . . +x,
7
2 4 -
x, + x,
2
e,,
10s:
+ SS: + 6s:
c)
24
P.
10-7 Encuentre el estimador de mxima similitud del parmetro c de la distribucih de
Poisson, basado en una muestra aleatoria detamafio n.
10-8 Determine el estimador dec en la distribucih de Poisson por el mtodo demomentos. basado en una muestra aleatoria detamao n.
10-9 Determineel
estimadorde mximasimilituddelparmetro
exponencial, con base en una muestra aleatoria detamalio n.
A. enla
10-10 Encuentreelestimador
distribuci6n
elmtodode
326
10-11 Determineestimadoresde
deladistribucin
n.
10-13 SeaXuna variable aleatoria geomtricacon parmetrop. Determineel estimador de
mxima similitud dep con base en una muestra aleatoria detamaio n.
10-14 Sea X una variable aleatoria deBernoulli con parmetro p. Encuentre un estimador
de p por el mtodo de momentos, con base en una muestra aleatoria de tamaon.
10-15 S e a X una variable aleatoriabinomial con parmetrosn (conocido) y p. Obtenga un
estimador de p por el mtodo de momentos, con base en una muestra aleatoria de
tamaio N .
10-16 Sea X una variable aleatoria binomial con parmetros n y p , ambos desconocidos.
n y p por el mtodo demomentos, con base en una muestra
Determine estimadores de
aleatoria de tamaio N .
10-17 SeaXuna variable aleatoriabinomial con parmetros n (desconocido) y p. Obtenga
el estimador de mximasimilitud de p, con base en una muestra aleatoria detamaio
N.
10-18 Establezca la funcin deprobabilidad para unamuestra aleatoria de tamao
n a partir
deladistribucinde
Weibull. Qu dificultadesseencontraran al obtener los
estimadoresdemximasimilitudde
los tresparmetrosde
la distribucidnde
Weibull?
10-19 Demuestre que si8es un estimador insesgado de 8, y si Km,
8 es un estimador consistente de8.
-,,V(O)
= O, entonces
f(x)
= ( y
=o
+ 1)XY
o<X< 1
e n otro caso
327
10-4 EJERCICIOS
f( X )
= Xe-h(X-X/)
x > x, > o
=o
en otro caso
. ,X , una muestra
;1: (Xi + - Xi)*es
insesgado para una eleccin apropiada deK. Determine el valor apropiado para K .
10-25 Considere el intervalo de confianza
para p con desviaci6n estandar (T conocida:
E x
Jx7n
b)
10-27 Un fabricante produce anillos de pist6n para un motor de autom6vil. Se sabe que el
328
a)
x,
cohete de combustible slido. Se sabe que ambos propulsantes tienen aproximaq = az= 3
damente la misma desviacin esthndar de tasa de quemado; esto es,
cm/s. Se prueban dos muestras aleatorias de n l = 20 y nz = 20 especmenes, y las
tasas de quemado medias de muestra son X, = 18 cm/s y Tz = 24 cmls. Construya
un intervalo con 99 por ciento de confianzarespecto a la diferencia de medias dela
tasa de quemado.
329
10-4 EJERCICIOS
10-35 Dos formulaciones diferentes de gasolina sin plomo se estn probando para estudiar
sus nmeros deoctanaje. La varianza del nmero de octanaje
para la formulacin 1
221 6
2225
231 8
2250
u)
b)
c)
2237
2301
2255
2238
2249
2281
2275
2300
2204
2263
2295
221 7
10-37 Una mhquina produce barras metlicas que se usan en el sistema de suspensin de
8.24mm
8.21
8.23
8.25
8.26
8.23mm
8.20
8.26
8.19
8.23
8.20mm
8.28
8.24
8.25
8.24
ensamblar una tarjeta de circuito impreso. Qu tan grande debe serla muestra si el
ingeniero desea teneruna confianza del 95por ciento de queel error en la estimacion
de la media esmenorque .25 minutos? Ladesviacin estndardel tiempo de
ensamble es .45 minutos.
10-40 Una muestra aleatoria de tamaiio 15 de una poblacin normal tiene mediaX = 550 y
varianza
330
CAPiTULO 10 ESTIMACI6N DE
a)
b)
c)
PARAMETROS
10-41 Una mquina de bebidas preparadas se ajusta para que agregue cierta cantidad de
jarabe en una cmara donde tste semezcla con agua carbonatada. Se encuentra que
unamuestraaleatoriade20bebidastiene
un contenidodejarabemediode
X = 1.10 onzas lquidasyunadesviacinestndar
de S = .O25 onzas lquidas.
Obtenga un intervalo de confianza de dos lados del 90 por ciento respecto a la
cantidad media de jarabemezclado con cada bebida.
10-42 Dos muestras aleatorias independientes de tamaos n i = 18 y n2 = 20 se toman de
dos poblaciones normales. Las medias de las muestras son XI = 200 y X2 = 190.
Sabemos que las varianzas son o: = 15 y o: = 12.Encuentrelosiguiente:
a) Un intervalo de confianza de dos lados del 95 por ciento respecto a p1- pz.
b) Un intervalo de confianza inferior del 95 por ciento en pI- p 2 .
c) Un intervalo de confianza superior del 95 por ciento en pl - ,uz.
10-43 El voltaje de salida de dos tipos
diferentes de transformadores se est investigando.
Diez transformadores de cada tipo se seleccionan al azar y se mide el voltaje. Las
medias de muestra song,= 12.13 volts y Xz = 12.05 volts. Sabemos que lasvarianzas
del voltaje de salida para los dos tipos de transformadores son o: = .7y o;= .8,
respectivamente.Construyaunintervalodeconfianzadedosladosdel95porciento
respectoaladiferenciaenelvoltajemedio.
10-44 Se tomaron muestras aleatorias de tamao 20 de dos poblaciones normales inde-
pendientes. Las mediasy las desviaciones estndarde las muestras fueron X,= 22.0,
1.8. X2 = 21.5 y sz = 1.5. Suponiendo que o: = 02, obtenga lo siguiente:
a) Un intervalo de confianza de dos lados del 95 por ciento respecto a p I - pz.
b) Un intervalo de confianza superior del 95 por ciento respecto a pI- pz.
c ) Un intervalo de confianza inferior del 95 por ciento respecto a p , - p2.
sI =
331
10-4 EJERCICIOS
a)
b)
c)
10-49 Construya un intervalo de confianza de dos lados del 95 por ciento respecto a la
varianza de los datos del espesor depared en el ejercicio 10-38.
10-50 En una muestra aleatoria de 100
bombillas elkctricas, se encontr que la
desviacin
estiindar de muestra dela vida delas mismas era de12.6 horas. Calcule un intervalo
de confianza superior del 90 por ciento respecto a la varianza de la vida de las
bombillas.
10-51 Considere los datos en el ejercicio 10-44. Construya un intervalo de confianza de
dos ladosdel
o:/o:.
10-52 Considere los datos en el ejercicio 10-45. Construya lo siguiente:
a)
10-55 Qu tan grande debe seruna muestra en el ejercicio 10-54 para tener una confianza
poseen al menos dos aparatos de televisin. Qu tan grande debe ser la muestra si
CAPITULODE
10 ESTlMAClbN
332
PARAMETROS
se desea tener
una confianza del 99 por ciento de queel error al estimar est cantidad
sea menor que .Ol?
10-58 Se esta realizando un estudio para determinar la eficacia de una vacuna contra el
moquillo de cerdo. Seaplic la vacuna a una muestra aleatoria de3000 sujetos, y de
este grupo 130 contrajeron la enfermedad. Un grupo de control de 2500 sujetos
seleccionados al azar no fue vacunado,y de este grupo170 contrajeron la enfermedad. Construya un intervalo de confianza del 95por ciento respecto a la diferencia
en las proporcionesp , - p 2 .
diseo
de
17
16
21
14
18
24
16
14
21
23
13
18
Lenguaje diseo
de
18
14
19
11
23
21
10
13
19
24
15
20
10-4
EJERCICIOS
333
estos mismoshasta que las llantasse desgastan. Los datos semuestran a continuaci6n
(en kil6metros):
Auto
Marca 1
Marca 2
36,925
45,300
36,240
32,lO0
37,21O
48,360
38,200
33,500
34,318
42,280
35,500
31,950
38,015
47,800
37,81O
33,215
a
p, - p2,pl - p3,y p2- p3tales que haya al menos una probabilidad de .95 de quelos
tres intervalos conduzcan simulttineamente a conclusiones correctas.
Captulo 11
Pruebas de hiptesis
11-1 Introduccin
11-1.1
Hipdtesis estadsticas
Una hiptesis estadstica es un enunciado acerca de la distribucin de probabilidad de una variable aleatoria. Las hiptesis estadsticas a menudo involucran uno
o ms parmetros deestadistribucin. Por ejemplo, supngase que estamos
interesados en la resistencia compresiva media de un tipo particular de concreto.
Especficamente, estamos interesados en decidir si la resistencia compresiva
media (digamos p) es o no de 2500 psi. Podemos expresar estode manera formal
como
Ho:p = 2500 psi
H, : p # 2500 psi
(11-1)
336
que 2500 psi, se le llamahiptesis alternativa de dos lados.En algunas situaciones, podemos estar interesados en formular una hiptesis alternativa de un lado,
como en
H,: p
2500 psi
(11-2)
11-1
337
INTRODUCC16N
Ningn
error
Error del tipo I
Ho esfalsa
Error del tipo I1
Ningn error
se han determinado un poco arbitrariamente. En las secciones siguientes mostraremos c6mo construir una estadstica de prueba apropiada para determinar la
regi6n critica para diversas situaciones de prueba de
hip6tesis.
11-1.2 Errores de tipo I y tipo I1
P=P
(1 1-3)
(1 1-4)
(1 1-5)
338
2300
25002600
2400
2700
I.I
el
11-1
339
INTRODUCC16N
1.o0
2500
/J
de lacurva
//
2500
P
340
Hoz P
= EL0
HI: P
P"
Esto implicaria que laregi6n crtica selocaliza en la cola superior de la distribuci6n de la estadstica deprueba. Esto es, si ladecisi6n se basara en elvalor de la
media de muestra X, entonces rechazariamos Ho en la ecuaci6n 11-6 si X es
demasiado grande. La curvacaracterstica de operacibn para la prueba correspondiente a esta hip6tesis se muestra
en la figura 11.4, junto con la curva caracterstica de operacidn para
una prueba bilateral. Observamos que cuando es cierto que
1.m
Curva CO para
una prueba
bilateral
cb
!
J
11-1 INTRODUCC16N
341
Y
(11-8)
En la ecuaci6n 11-1, estamos suponiendo quep no puede ser menor que ,u,,,y la
curva caracterstica de operaci6n no esta definida para valores de p po.En la
ecuacibn 1 1-8, suponemos quep puede ser menor que p,, y que enuna situaci6n
tal seria deseable aceptar Ho. De modoque para la ecuaci6n 11-8, lacurva
caracterstica de operaci6n se define para todos los valores de u
, < p,,.Especficamente, si p S p,,, tenemos p(p) = 1 - a!(p),donde a(p) es el nivel de
significacibn como una funci6n de p. En situaciones en las queel modelo de la
ecuaci6n 11-8 es apropiado, definimos el nivel de significaci6n de una prueba
como el valor maxim0 de la probabilidad a! del error de tipo I; esto es, el valor
de 01 en p = po. En situaciones en las que sea apropiada la hip6tesis alternativa
unilateral, escribiremos usualmente la hip6tesis nula con la igualdad; por ejemplo, Ho: p = p,,.Esto se interpretara como la inclusidn de los casos Ho: p S poo
Ho: p a po,cuando sea apropiado.
En los problemas en que se indican procedimientos de prueba unilateral,
los analistas en ocasiones tienen dificultades para la elecci6n de una formulaci6n apropiada de la hip6tesis alternativa. Por ejemplo, sup6ngase que un
embotellador de refrescos compra botellas no retornables de 10 onzas a una
compafia vidriera. El embotellador desea tener la certeza de que las botellas
o resistencia al
superaran la especificacidn relativa a la presidn interna media
rompimiento, que para las botellas de 10 onzas es de200 psi. El embotellador
ha decidido formular el procedimiento de decisi6n para un lote especfico de
342
(11-9)
(11-10)
11-2
343
x)=
-z&?
XLY12
zo
344
zo
-zap
(11-136)
y no rechazar Ho si
(11-14)
La ecuaci6n 1 1 - 14 define la regin de aceptacin para Ho y la ecuacin 1 1- 13
define la regin crtica o regin de rechazo. La probabilidad del error de tipo I
para este procedimiento de prueba es a,
40 cm/s
HI : p
40 cm/s
- 41.25
40
= 3.125
2/m
Puesto que a = .05, las fronteras de la regin crtica son ZOZ= 1.96 Y -2025
-1.96, y notamos que Z, cae en la regi6n crtica. Por tanto, Ho se rechaza, y
concluimos que la tasa dequemado media no es igual a 40 cmh.
11-2
PRUEBAS DE HIP6TESIS
SOBRE
LA MEDIA,
CON
VARIANZA
CONOCIDA
345
(11-16)
De modo similar, para probar
(11-17)
z o < -z,
11-2.2 Eleccibn del
(11-18)
tamafio de la muestra
Al probar las hiptesis de las ecuaciones 11-1, 11-15 y 1 1-17, el analista selecciona directamente la probabilidad a del error de tipo I. Sin embargo, la probabilidad p del error de tipoI1 depende de la eleccin del tamaao de muestra. En
esta seccin, mostraremos cmo seleccionar el tamaAo de muestra para llegar a
un valor especificado de p.
Considrense las hiptesis de dos lados
Ho: P = Po
P l : P + Po
(11-19)
346
Bajo HI: p # p~
H, y H,
(11-20)
Hemos elegido d de manera que un conjunto de curvas caractersticas de operacin puede emplearseen todos los problemas independientemente
del valor de,uo
y c.Del examen de las curvas caractersticas deoperacin o la ecuacin 1 1-20 y
la figura 1 1.6 notamos que
I . Cuanto ms lejano est
el valor verdadero de la media p de ,uo, tanto menor
ser la probabilidad fidel error de tipo I1 para n y a dados. Esto es, vemos
11-2
PRUEBAS DE HIP6TESIS
SOBRE
LA MEDIA,
CON
VARIANZA
CONOCIDA
347
y del diagrama VIa del apndice, con n = 25, encontramos que /3 = .30. Esto es,
si la verdadera tasa de quemado mediaes p = 41 cm/s, entonces hay un 30% de
posibilidad de que estono sea detectado en la prueba con n = 25.
Ejemplo 11.3 Considrese de nuevo el problema del propulsor a chorro en el
ejemplo 1 l. 1. Supngase que al analista le gustara diseiiar la prueba de modo
que si la verdadera tasa media de quemado difiere de 40 cm/s en tanto como 1
cm/s, la prueba detectar esto (es decir, se rechaza H,: p = 40) con una alta
probabilidad, por ejemplo .90. Las curvas caractersticas de operacin pueden
utilizarse para determinar el tamaiio de muestra que nos dar tal prueba. Puesto
que d = Ip -p,,l/o = 1/2, a = .O5 y p = . I O, encontramos del diagrama VIa del
apndice que el tamao de muestra requerido es n = 40, aproximadamente.
En general, las curvas caractersticas deoperacin involucran tres parmetros:
cualesquierados de ellos, el valor del tercero puede determinarse.
Hay dos aplicaciones comunes de estas curvas:
p, 6 y n. Dados
En los diagramas VIc y V I d del apndice se presentan las curvas caractersticas de operacin para las alternativas de un lado. Si la hiptesis alternativa es
348
(11-22)
d = Po - P
~
(11-23)
o si 6 > O,
p = cp z,
puestoque @(-Z=,* - 6&/0)
tenemos
(1 1-24)
n=
(Z,/,
+ z$J*
S2
(11-25)
(2,+ zfl)2Uz
(11-26)
Ejemplo 11.4 AI regresar al problema del propulsor a chorro del ejemplo 1 1.3,
notamos que CT = 2, 6 = 41 - 40 = I , a = .O5 y p = . 1 O. Puesto que Zd2 = Zo2s
= 1.96 y Z, = Z ,o = 1.28, el tamao de muestra requerido para
detectar esta
11-2 PRUEBAS DE
HIP6TESIS
349
( Za,2 + ZS)a2
s2
(1.96 + 1 .28)222
42
H,: 0
e,,
e,,
,u =
11-2.5
Valoresde P
350
CAPTULO 1 1
PRUEBAS DE HIP6TESIS
P=
2 [ 1 - @ ( 1 Z,l)]
1-@(Z,)
@(Zd
11-3 PRUEBASHIP6TESIS
DE
351
(11-29b)
Las hiptesis alternativasde un lado se analizan de manera similar. Para
probar
4 ) :
111
HI: PI
= 112
112
(11-30)
352
Hoz P1 = 112
(11-32)
H1: P1 < P2
(11-33)
Ejemplo 11.5 La gerente de planta de
una fhbrica enlatadora dejugo de naranja
esta interesada en comparar
el rendimiento dedos diferentes lneas de
produccih.
Como la linea nmero 1 es relativamente nueva, sospecha queel nmero de cajas
que se producenal da es mayor que el correspondiente a la vieja
lfnea 2. Se toman
datos alazar durante diez daspara cada linea, encontrimdose queSr', = 824.9 cajas
por da y X2 = 81 8.6 cajas porda. De la experienciacon la operacidn de este tipo
de equipo se sabe queo: = 40 y 022 = 50. Deseamos probar
Ho: P1 = P2
H1: P1 >
P2
x1 - x2
Zo=
-+n1
/y
- 824.9 - 818.6
=
-+-
n2
2.10
10
Las curvas caractersticas de operaci6n en los diagrama VIa, VIb, VIc y VId del
apdndice pueden utilizarse para evaluar la probabilidad del error de tipo I1 para
las hip6tesis en las ecuaciones 11-27, 11-30 y 11-32. Estas curvas tambin son
tiles en la determinaci6n del tamaiio de la muestra. Se presentan las curvas para
a = .O5 y a = .01. Para la hipbtesis alternativa de dos lados
en la ecuacibn 11-27,
la escala deabscisas de la curva caracterstica deoperacidn en los diagramas VIO
y VIb es d, donde
(11-34)
353
- P1
d=
/mS
(11-36)
y n = n, = n2.
deobtenci6ndedatos
No esraroencontrarproblemasdondeloscostos
difieren en forma sustancial entre dos poblaciones, o donde una varianza de
poblacidn sea muchom8s grande quela otra. En esos casos, a menudo se utilizan
tamaios de muestra desiguales.
Si n, # n2, las curvas caracteristicas de operaci6n
pueden presentarse conun valor equivalente de n calculado de
(1 1-37)
Si n, # n2,y sus valores se fijan de antemano, entonces se emplea
la ecuaci6n
directamente para calcularn, y las curvas caracteristicasde operaci6n se presentan con una d especificada para obtener p. Si estamos dando d y es necesario
determinar n, y n2 para obtener una p especificada, por ejemplop*, se suponen
entonces valores triviales de n, y n2, se calcula n en la ecuaci6n 11-37, y se
presentan las curvas con el valor especificado de
d y se determina p. Si p = p*,
entonces los valores triviales de n, y n, son satisfactorios. Si p # p*, se hacen
ajustes a n , y n2 y se repite el proceso.
PI - P2
10
CAPTULO 1 1
354
PRUEBAS DE HIP6TESIS
&/m)
es pequefa
Esta aproximacin es vlida cuando cD(-Zd2 comparada con p. Para la alternativa de un lado, tenemos n, = n2 = n, donde
(11-39)
n=
(Z,
+ Zp)( +
0,
S2
02)
(1.645
+ 1.28)2(40 + 50)
w
= S
11-4
355
la prueba. Cuandolasuposici6n
no es razonable, podemos especificar otra
y emplear algn metodo general de
distribuci6n (exponencial, Weibull, etc.)
construccin de la prueba para obtener un procedimiento vidido, o podramos
emplearunadelaspruebasno
parambtricas quesonvalidaspara
cualquier
distribucidn de base (vbase el captulo 16).
11-4.1
Analisis estadstico
(11-40)
El procedimiento de pruebase basa en la estadstica
(11-41)
t,/2.11-
(11-42a)
o si
to <
-ra/2.n-1
(11-42b)
donde td2,,-, y -td2, ,-, son los puntos porcentuales al2 superior e inferior de la
distribucin t con n - 1 grados de libertad.
Para la hiptesis alternativa deun lado
(11-43)
to de
( a , ,r
-1
(11-44)
356
se rechazara Ho si
to < - t o , n-
(11-46)
H,: p
150 psi
H,: p
150 psi
t o = ___ s/J;;
-
152.18 - 150
= 2.07
x- Po
~
S,&
11-4
PRUEBAS DE
HIP6TESIS SOBRE LA MEDIA DE UNA DISTRIBUC16N NORMAL
357
d h
Z+ U
(11-47)
350
CAPTULO 11
PRUEBAS DE HIP6TESIS
11-5
11-5.1
Caso 1:
o: = 0:= c r 2
(11-51)
Sup6ngase queX,,, X,,,
. . . ,X,,, es una muestra aleatoria den, observaciones de
X , , y que X,,,
XZ2,
. . . ,Xk2, es una muestra aleatoria de n, observaciones de X,.
Sean X,, X,, S : y S las medias y las varianzas de las muestras, respectivamente.
Puesto que tantoS:comoSjestiman la varianza comn o 2, podemos combinarlas
para producir una sola estimacin, digamos
S;
(nl =
1)s;+ ( n 2 - 1)s;
n,
(11-52)
+ n2 - 2
Si H,:
x, - x,
(11-53)
En consecuencia, si
(11-54a)
o si
(11-54b)
,u,
rechazamos H,:
= p,.
Las alternativas de un lado se tratan de modo similar. Para probar
No: Pl
= P2
H1: 111
* a .n ,
(11-55)
P2
+n 2 -2
,u, = p,
(11-56)
360
(11-57)
calclese la estadisticade prueba to y rechcese Ho:
to <
,u, =
,u2
si
(11-58)
-ta.n,+n2-2
11.1 = !-2
H,: 11.1
P2
n,
+ ( n 2 - 1)s;
+ n, - 2
(7)3.89
S:
+ 7(4.02)
= 3.89, n2 = 8,
3.96
8+8-2
,
La estadstica de prueba es
/=
-+1.99/x
"
91.73 - 93.75
x1 - x2
to =
sp
-2.03
,u,
11.5.2
Caso2: 0 : 2 0:
11-5 PRUEBAS DE HIP6TESIS SOBRE LAS MEDIAS DE DOS DISTRIBUCIONES NORMALES 361
probar H,:
x, - x2
to*=
/ S :+ v
(11-59)
n2
'
n2
\n1
n,
n2l
+1 +
(1 1-60)
n2+ 1
Diseo 1
Diseo 2
=
=
15 X, = 24.2
10 X, = 23.9
S
: =
S; =
10
20
Deseamos probar
donde se supone queambas poblaciones son normales,pero no estamos dispuestos aconsiderar quelas varianzas desconocidas a: y o:son iguales. La estadstica
de prueba es
- x,
"
x 1
t,:
\ -n ,+ - n 2
Los grados de libertad en
24.2 - 23.9
-+-
0.18
lo
362
[;
+ %)
2
v =
Ill
+1 +
Qr -tos,, 6 ,
j i 3 lo)
10
20
-2=
(.sf/.,)
Puesto que
(S;/.:)
n2
(lO/lS)
+1
16
+
=
(20/10)*
- 2 ~ 1 6
11
y,.
Las curvas deoperacin caractersticas en los diagramas VIe, VIf; VIg y VIh del
apCndice se emplean para evaluar elerror de tipo I1 para el caso donde o: = o:
= 0 2 .Desafortunadamente, cuando o: # o: la distribucin de se desconoce
si la hiptesis nula es falsa,
y no se dispone de curvas caractersticas deoperacin
para este caso.
Para la alternativa de dos lados en la ecuacin 1 1-51, cuando o: = o = o2
y n, = n2 = n, se emplean los diagramas VIe y VIf con
(11-61)
Para usar estas curvas, las mismas deben considerarse con el tamafio de muestra
n* = 2n - l. En lo querespecta a la hiptesis alternativa deun lado de laecuacin
1 1-55, utilizamos los diagramas VIg y VIh y definimos
(1 1-62)
PARES
11-6 PRUEBA t POR
363
S,
n =
n*+ 1
20+ 1
--
364
H,: p D
O
(11-64)
H,:p, f O
(1 1-65)
donde
(11-66)
(11-67)
d
to=
___
sd/6
0.2736
0.1 356/fi
- = 6.05
365
Viga
Mtodo
Karlsruhe
de
S1 / 1
s2/1
S3/ 1
S4/ 1
S5/1
s2/ 1
s2/2
S2/3
S2 / 4
Mtodo de Lehigh
Diferencia
1.O61
0.992
1.O63
1.O62
1.O65
1.178
1.O37
1.O86
1.O52
1.186
1.151
1.322
1.339
1.200
1.402
1.365
1.537
1.559
dj
0.119
0.1 59
0.259
0.277
O. 138
0.224
0.328
0.451
0.507
x, x,
/x
-
to
sp
,I
x,- x2
"
los numeradores de ambas estadsticas son idnticos. Sin embargo, el denominador de la prueba t de dos muestras se basa en la suposicin de que X,y X,son
independientes. En muchos experimentos por pares, hay una fuerte correlacin
positiva entre X , y X,. Esto es,
V ( E )=
=
v( x, x,)
v( X,)+ v( x,)
-
2CO"(
x,,x,)
366
11-7
367
(11-68)
x:,=
(n - 1 ) s 2
(11-69)
01:
o si
( 1 1-70h)
H0: u * = u(:
(11-71)
H , :o 2 > u,:
rechazaramos Ho si
x:,x:.,,
~
(11-72)
rechazaramos Hn si
(11-74)
388
H,: u 2 = .o2
x; =
( n - 1)s'
acl
2
(19).0225
.o2
21.38
Del diagramaVIR, con A = 1.23 y n = 20, encontramos que p = .60. Esto es, s610
hay un 40% de posibilidades de que Ho:o 2 = .O2 se rechace si la varianza es
11-7
PRUEBAS
HlPdTESlS
DE
SOBRE LA VARIANZA
369
realmente tan grande como o = .03. Para reducir p, debe emplearse un tamafio
de muestramhs grande. De la curva caracterstica de
operaci6n, notamos que para
reducir /?a .20 es necesario un tamaiio de muestra de75.
11-7.3 Procedimiento de prueba de una muestra grande
2,=
S-u
(11-76)
U/&-
H,: u 2 = u;
(11-77)
HI:u 2 # u:
sustityase o, por o en la ecuaci6n 11-76. En consecuencia, la estadstica de
prueba es
(11-78)
y rechazaramos Ho si 2, >,Z
, o si Z, < Zd2. Se emplearia la misma estadstica
de prueba en las alternativas de un lado. Si estamos probando
H,: u 2 = u:
H I : u 2 > u:
rechazaramos H,,
si Z,
(11-79)
(11-80)
370
H,:
0 2 =
H,:
0 2
6.25
< 6.25
X 104
X
104
u,fi
0.021 - 0.025
O.O25/m
= - 1.60
Suphgase que son dos las poblaciones de interts, por ejemploX , N(p,, o:) y
X , N(p2,o;),donde p , , o:,p 2 y o: se desconocen. Deseamos probar hiptesis
relativas a la igualdad de las dos varianzas, Ho: o: = o:. Considtrese que se
disponen dos muestras aleatorias de tamafio n, de la poblacin 1 y de tamafio n2
de la poblacin 2, ysean S : y S : las varianzas demuestra. Para probar la
alternativa de dos lados
(11-81)
H,:
U;
371
(11-83a)
o si
O'
< F1-a/2,nl-1,n2-1
(11-836)
F1-a/2,nl-l.n2-l
(11-84)
F a / 2 . n2- 1. n, - 1
La misma estadstica de prueba puede utilizarse para probar hip6tesis alternativas deun lado. Puesto que la notaci6nX,y X,es arbitraria, dCjese que X,denote
lapoblaci6n que puedetenerlavarianza
miis grande.Porconsiguiente,
la
hip6tesis alternativa de un lado es
(11-85)
Si
H,: u;
= u:
H , : u:
u:
= 3.89 y S = 4.02.
7, = 4.99 y F.g75,
7, = (F.025,7,
7)-1 = (4.99)" = .20.
Si a = .05, tenemos que F.025,
372
Por tanto, no podemos rechazar Ho: 07 = o:,y concluimos que no hay suficiente
evidencia de que laconcentracin afecta la varianza de la produccin.
11-8.2
Los diagramas VIO, Vlp, VIq y VIr del apndice proporcionan las curvas caractersticas de operacin para la prueba de F dada en la seccin 1 1-8.1, para a =
.O5 y a = .01, suponiendo que n, = n2 = n. Los diagramas VIOy VIP se emplean
con la alternativa de dos lados de la ecuacibn 1 1-8 1. Ellos grafican p contra el
parhmetro de abscisa
(11-87)
para diversasn, = n2 = n. Los diagramas VIq y VIr se empleanpara la alternativa
de un lado de la ecuacin 11-85.
Ejemplo 11.17. Para el problema del anlisis de la produccin delproceso
qumico en el ejemplo 1l . 16, supngase que si una de las concentraciones afect6
la varianza de laproduccibn de manera que una varianza fue cuatro veces la otra,
deseamos detectar sta con probabilidad de por lo menos 3 0 . Qu tamafio de
muestra debe utilizarse?Ntese que si una varianza es cuatro veces la otra,
(11-88)
11-9 PRUEBAS
373
(11-89)
y rechcese Ho:p = p o si
zo 'zap.
zo < -z,,*
(11-92)
374
Ho: p = .O5
H I : p > .O5
Una muestra aleatoria de 200 dispositivos produce seis defectuosos. La estadstica de prueba es
6 - 200(.05)
-1.30
(11-93)
Si la alternativa esH,: p < po, entonces
(11-94)
-P + Z a / Z F X F
(11-95)
375
(11-96)
para la alternativa de dos ladosy
(11-97)
para las alternativas deun lado.
+ 1.645/(.05)(.95)/200
/( .07)( .93)/200
=
cP(0.30)
.6179
Esta probabilidad de error del tipo I1 no es tan pequea como podra parecer,
aunque n = 200 no es en particular grande y .O7 no est muy alejado del valor
nulo p o = .OS.Supngase que deseamos tener un error /3 no mayor que .10 si el
valor verdadero de lafraccin defectuosa estan grande como p = .07. El tamao
de muestra requerido se encontrara de laecuacin 11-97 como
n=[
=
1.645/-
+ 1.28/0.07 - 0.05
1174
376
( I 1-98)
{m
$1
z=
$=
- $2
x 1
x 2
n1
n2
-P2
(11-99)
Si
(11-100)
11-10 PRUEBAS
HIP6TESIS
DE
377
Ho: P1 = P2
HI: P1
+P2
+ 178
300 + 260 = .7643
+ x2
250
.8333 - .6846
- $2
p es
+ 1/JZ?) - ( Y , - Y 2 )
U-
1'1
~-1;1
378
donde
R I P 1 + n 2 P2
p=
n1 + n 2
q = n,(l
-PA
-t
Pz)
n1 + n2
Y O&-A est dada por la ecuacin 1 1-101. Si la hiptesis alternativa es HI:p 1 >
p2, entonces
,:(pi+
P 2 ) h
+ 42)/2
+ Z,$Pl% + P r q z
IZ
(11-105)
(PI - P?)?
1 - p , . Para las alternativas de un lado, sustityase Z,,,
donde 41 = 1 - p I y p , =
en la ecuacin 1 1- 105 por Z,
= Y2
H , : P1 > P?
379
Debido a que los resultados son igualmente probables, la probabilidad de exactamente X1 xitos en la muestra 1 es la razn del nmero de resultados de la
muestra 1 que tieneX I xitos al nmero total de resultados, o
P(X1 = x1I Y xitos en nl
+ n2 respuestas)
(11-106)
380
11-11
381
(11-107)
distribucinhipotticaestimada
pormedio deestadsticas de muestra.Esta
aproximacin se mejora cuando n aumenta. Rechazaramosla hiptesis de que X
seajusta a la distribucinhipottica si >
,.
Un punto que debe advertirseen la aplicacin de este procedimiento
de prueba
se refiere a la magnitud de las frecuencias esperadas.Si estas frecuencias esperadas son demasiadopequeas,entonces
no reflejar la desviacin de las
observadas respecto a las esperadas, sino
slo las ms pequeas de las frecuencias
esperadas. No hay un acuerdo general en relacin con el valor mnimo de las
frecuencias esperadas, aunque los valores de 3, 4 y 5 se utilizan ampliamente
como mnimos. Si la frecuencia esperada es demasiado pequea, puede combinarse con la frecuencia esperadaen un intervalo de clase adyacente.Las frecuencias observadas correspondientes se combinaran
tambin en ese caso, y k se
reducira en 1. No se requiere que los intervalos de clase sean de igual ancho.
A continuacin brindaremos tres ejemplos del procedimiento de prueba.
x;
x;
382
Total
n
95
loo
99
108
94
1000
~~
Frecuencias
observadas 9 93
94
Frecuencias
esperadas E, 100
100
100 1000
x; = ic= l
-
(94
(O, - E , ) 2
E,
100
(93 -
100
+ ... +
(94 -
loo)*
1O0
3.72
Puesto que
= 16.92 no somos capaces de rechazarlahiptesisdequelos
datos provienen de una distribucin uniforme discreta. En consecuencia, el
generador de nmeros aleatorios parece estar trabajando en forma satisfactoria.
Ejemplo 11.23 Una distribuci6n discreta Se consideraenformahipottica
que el nmero de defectos en tarjetas de circuitoimpreso sigue una distribucin
de Poisson. Una muestra aleatoria de n y 60 tarjetas impresas se ha colectado,y
observado el nmero de defectos. Se obtienen los siguientes datos:
Nmero de
defectos
Frecuencia
observada
O
1
2
3
32
15
9
4
H , : p ( x ) no es de Poisson con X
.75
Frecuencia
esperada
28.32
21.24
7.98
1.98
Probabilidad
.472
.354
,133
.O33
1
2
3
Frecuencia
observada
32
1
2
15
13
x; =
(32
28.32)2
28.32
-
(15 - 21.24)'
21.24
Frecuencia
esperada
28.32
21.24
9.96
=
3 - I - I grados de libertad) se
(13
9.96)2
9.96
3.24
384
pi
P(
I
a,)=
JU
f ( x ) dx
u,-1
Frecuencia
esperada E,
Frecuencia
observada O;
12.5
12.5
12.5
12.5
12.5
12.5
12.5
12.5
1O0
10
14
12
13
11
12
14
14
1O0
11.986
12.014
12.040
12.066
12.094
12.132
x; =
c (0,
x
I=
- a
E,
(10 - 12.5)2
12.5
(14 - 12.5)l
(14
+ ...
12.5
i-
12.5)
12.5
1.12
Puesto que se han estimado dos parmetros en la distribucin normal, referiramos = l. 12 como una distribucin ji cuadrada con k - p - 1 = 8 - 2 - I = 5
grados de libertad. Luego ~ 2 =
~ 13.26,
.
y de este modo concluiramos que no
hay raz6n para creer que el voltaje de salida se distribuye normalmente.
11-1 1
385
Los mtodos grficos tambin son tiles cuando se selecciona una distribucin
de probabilidadpara describir datos.La graficacin de probabilidades un mtodo
grfico para determinar
si los datosse ajustan a una distribucin hipottica
basada
en un examen visual subjetivo de los datos. El procedimiento general es muy
simple y puede efectuarse
con rapidez. Lagraficacin de la probabilidad requiere
papel griifico especial, conocido como papel probabilidad,
de
que se ha diseado
para la distribucin hipottica.Se dispone ampliamente de papel de probabilidad
para las distribuciones normal, lognormal, de Weibull y diversas distribuciones
ji cuadrada y gamma. Para construir una griifica de probabilidad, se clasifican
primero las observaciones en la muestra demhs
la pequea a la miis grande. Esto
es, la muestra X , , X,, . . . ,X,,
se arregla como X(,),X(2,,. . . ,X,, , donde X ( J )S
X, + ,).Las observaciones ordenadasX ,j ) se grafican despus contra su frecuencia
acumulativa observada ( j - S ) / n en papel de probabilidad apropiado. Si la
distribucin hipottica describe de manera adecuada los datos, los puntosgraficados caeriin aproximadamente sobre una lnea recta; si los puntos graficados se
desvan de modo significativo deuna lnea recta, entonces el modelo hipotetico
no es apropiado. Usualmente, la determinacin de si los datos se grafican o no
como una lnea recta es subjetiva.
Ejemplo 11.25 Para ilustrar la graficacin de la probabilidad, considkrense los
siguientes datos:
- .314,
- 1.390, - .563,
1.436, 1.153,
.504,
- .S01
x,, ,
1.436
1
2
3
4
5
6
7
8
9
10
1.390
- .801
- ,563
- .314
- .179
.504
,863
1.O80
1.153
(i - .5) / n
.O5
.15
.25
.35
.45
.55
.65
.75
.85
.95
386
8o
95
20
10
98
-20
1
I
-1
-10
I
-5
10
15
20
-20
x (.I 1
Figura 11.7 Grafica deprobabilidadnormal.
P(z
I 2,) =
o( z,)
2.c
1.c
zl
-1.0
-2.0
--z
-1.0
1.o
2.0
1
2
3
4
5
6
7
8
9
10
- 1.390
,8801
- ,563
- ,314
- ,179
,504
,863
1 .O80
1.153
1.436
-
.O5
.15
.25
.35
.45
.55
.65
.75
.85
.95
- 1.64
- 1 .O4
- 0.67
- 0.39
-0.13
0.13
0.39
0.67
1 .O4
1.64
388
CAPTULO 11 P RU E BA S DE H I P T E S I S
P,
para elegir una distribucin que modele los datos. Por ejemplo, al estudiar los
datos de defectos de tarjetas de circuito en el ejemplo 11.23 se consider de
manera hipottica una distribucinde Poisson para describirlos, debido a que las
fallas son fenmenos de eventos unitarios, y tales fenmenos a menudo son
mejor modelados por una distribucin de Poisson. En ocasiones la experiencia
previa puede sugerir la eleccinde la distribucin.
En situaciones en las que no
hay experiencia previa o alguna teora para sugerir
una distribucin que describa los datos,
el analista debe confiar en otros mtodos.
La inspecci6n de un histograma de frecuencias puede sugerir a menudo una
389
Pz =
E(X -d
.4
Jp^,
M3
= (M2)3/2
donde
I1
390
GI
1 '
=
oIJ
o,,
(11-10s)
1=1
Columnas
Renglones
o,,
o12
4 ,
o
2
2
...
. ..
...
...
C
01,
4,
11-12
391
Eli
nEi.6
' J
0' J
= J'l
0' J
(11-109)
;=I
(11-110)
aproximadamente, y rechazaramos la hiptesis de independencia si
xi >
Xi>(r-l)(c-l).
Ejemplo 11.26. Una compaiia tiene que escoger entre tres planes de pensin.
La administracin desea conocerlasipreferencia poralgn plan es independiente
de la clasificacin del empleo. Las opiniones de una muestra aleatoria de 500
empleados se muestran en la tabla 11.5. Podemos calcular ii = (3401500) = .68,
= (160/500) = .32,
= (200/500) = .40,
= (200/500) = .40 y
=
(100/500) = .20. Las frecuenciasesperadaspueden calcularse a partirdela
ecuacin 11-109. Por ejemplo, el nmero esperado de trabajadores asalariados
que favorecen el plan 1 es
E,,
136
31
Total
Trabajadores
asalariados140 160
Trabajadores
hora
por
!60 60 60 40
Totales
200200
40
-
340
1O0
500
1
Trabajadores
asalariados
340
68 136 136
Trabajadores
160 32 64 64
hora
por
Totales
200
~
200
1O0
Total
500
392
S.. S ..5
..
r'
r'
x-
I;: K
I N
&?
i Ik
I<
I
J
I
op
eo
O
C
u)
al
'D
393
a"
bII
N-
L
C
'
A
LLO
x
u,-
rcu
I
;r
;r
\
II
5"
r
394
x:=
( O ! ,-
c E--
(160 - 136)2
(140
+
136
(60 - 64)2(60
136)2
136
(40 - 68)2
(40
68
64)*
64
32)2
= 49.63
64
32
Puestoque
= 5.99, rechazamos la hiptesisdeindependencia y concluimos
que la preferencia para los planes de
pensin no es independiente dela clasificacin de empleos.
I1-13
Resumen
Estecaptulohapresentado
la prueba de hiptesis. Los procedimientospara
probar hiptesis enmedias y varianzas se resumen en la tabla 1 1.7. La bondad de
ajuste de la ji cuadrada se present para probar
la hiptesis de que
una distribucin
emprica sigueuna ley de probabilidad particular. Los mtodos grficos tambin
son tiles en la prueba de la bondad del ajuste, en particular cuando los tamafios
de muestra son pequefios. Adems, se presentaron las tablas de contingencia de
dos vias para probar la hiptesis de que dos mtodos de clasificacin deuna
muestrasonindependientes.
Se estudi tambinel empleo de las tablas de
contingencia en la prueba de la homogeneidad de varias poblaciones.
11-14 EJERCICIOS
395
11-14 Ejercicios
11-1 Se requiere que la resistencia
al rompimiento de una fibra utilizada en la fabricacin
Una muestra aleatoria de10 tornillos produce un dimetro promedio de .2546 plg.
Pruebe la hip6tesis de queel dimetro medioreal de los tornillos es igual a .255
plg, empleando a = .05.
b ) Que tamaiio de muestra se necesitara para detectar un dimetro de tornillo
medio real de ,2552 plg con probabilidad de por lo menos .90?
a)
b)
11-5 Considere los datos en el ejercicio 10-28. Pruebe la hiptesis de que la vida media
de las bombillas elctricas es de 1000 horas. Use a = .05.
11-6 Considere los datos en el ejercicio 10-29. Pruebe la hiptesis de que la resistencia
compresiva media es igual a 3500 psi. Utilice a = . O ] .
396
Mquina 2
Mquina 1
16.03
16.04
16.05
16.05
16.02
16.01
15.96
15.98
16.02
15.99
j.. Q
a)
6)
c)
16.02
15.97
15.96
16.01
15.99
16.03
16.04
16.02
16.01
16.00
..
11.
/:-
11-8
,
,
,
os tipos de plsticos son apropiados para que los utilice un fabricante de componentes electrnicos. La resistencia al rompimiento de estos plsticos es importante,
Se sabe que
= o2= I .O psi. De una muestra aleatoria de tamao
n , = 10 y
n2 = 12 obtenemos X,= 162.5 y F2 = 155.0. La compaa no adoptar el plstico 1
a menos que su resistencia al rompimiento exceda la del plstico 2 al menos por 10
psi. De acuerdo con la informacin de la muestra, debe utilizarse el plstico I ?
.05.
1
fabricante de propulsores estinvestigando la desviacin lateral en yardas de
cierto tipo de proyectil de mortero . han observado los siguientes datos.
11-12
,
U
Se
Desviacin
Etapa
Desviacin
Etapa
1
2
3
4
5
.-
11.28
10.42
-~8.51
1.95
6.47
6
7
8
9
10
9.48
6.25
10.11
8.65
.68
~
11-14
397
EJERCICIOS
108 das
134
124
116
a)
b)
11.6
7.7%
14.6
9.9
Hay alguna evidencia de queel contenido medio detitanio sea mayor que 9.5%?
11-15 1 tiempo para reparar un instrumento electr6nico es una variable aleatoria medida
?t
159
224
222
149
280
379
362
260
1o1
179
168
485
212
264
250
170
Parece razonable que el tiempo medio real de reparaci6n sea mayor que 250 horas?
11-16 Se considerahipotCticamente que la rebaba producida en una operacin de acabado
metlico es menor que 7.5%. Se eligieron varios das al azar y se calcularon los
porcentajes derebaba.
5.51%
6.49
6.46
5.37
a)
b)
c)
7.32%
8.81
8.56
7.46
398
Ho: p
15
H , : p < 15
donde se sabe que
CT'
= 2.5. Si a = .O5 y lamedia real es 12, qu tamafo de muestra
es necesario para asegurar un error de tipo I1 de 5%?
11-18 Un ingeniero desea probar la hip6tesis de que el punto de fusi6n de una aleaci6n es
1000C. Si el punto de fusin real difiere de ste en m8s de 20, I debe cambiar la
proceso
Rendimientos (%)
1
2
24.2
21 .o
26.6
22.1
25.7
21.8
24.8
20.9
25.9
22.4
26.5
22.0
a)
muestra.
Alambre
1
2
Resistencia (ohms)
,141 ,140
,135
,138
.139
,140
,140
,139
,138
-
.144
-
Suponiendo que las dos varianzas son iguales, qu conclusiones pueden extraerse
respecto a la resistencia media de los alambres?
11-21 LOS siguientes son tiempos de quemado (en minutos) de sefales luminosas de dos
tipos diferentes.
11-14
399
EJERCICIOS
Tipo 1
82
75
73
a)
b)
63
81
57
66
82
Tipo 2
56
68 63
59 74
64
72
83
59
65
82
82
Pruebe la hiptesis de que las dos varianzas sean iguales. Use a = .05.
AI emplear los resultados de a), pruebe la hiptesis de que los tiempos medios
de quemado seaniguales.
\
instalacin,
una muestra
I
aleatoriaproduce
-x1)
x.
11-25 Considere los datos en el ejercicio 10-45. Suponiendo que 0: = O:, pruebe la
hiptesis de queel dimetro mediode las barras producidas enlos dos tipos diferentes
de mquinas no difieren. Emplee a = .05.
11-26 Una compafiia qumica produce cierta droga cuyo
peso tiene unadesviaci6n estandar
de 4 miligramos. Se ha propuesto un nuevo mtodo de produccin de esta droga,
aunque estninvolucrados
costos adicionales.Laadministracin
autorizara un
CAPTULO
HIPbTESIS
11 PRUEBAS DE
400
cambio en tkcnica
la
de produccin slo si la desviacin
estndar del peso en elnuevo
proceso es menor que4 miligramos. Si la desviacin estndar del peso en el nuevo
proceso es tan pequefla como 3 miligramos, a la compaa le gustaria cambiar los
mktodos de produccin con una probabilidad de por lo menos .90. Suponiendo que
el peso se distribuye normalmente y que a = .05, cuntas observaciones deben
efectuarse? Supngase quelos investigadores eligen n = 1O y obtienen los siguientes
datos. Es esta una buena eleccinpara n? Cul debe ser su decisin?
16.628 gramos
16.622
16.627
16.623
.
16.618
16.630 gramos
16.631
16.624
16.622
16.626
11-28 Se supone que la desviacin estndar de las mediciones que realiza un termopar
.O10 deseamos
especial es.O05 grados. Si la desviacin estndar es tan grande como
detectarla con probabilidad depor lo menos .90. Emplee a = .O l . Qu tamao de
muestra debe emplearse? Si se emplea este tamao de muestra y la desviacin
estndar S = .007, cul es su conclusin, empleando a = .01? Construya un
intervalo de confianza superior
del 95% para la varianza.
11-29 El fabricante de una fuente de poder est interesado en la variabilidad del voltaje de
salida. Ha probado12 unidades, elegidas al azar, con los siguientes resultados:
5.34
5.00
5.07
5.25
a)
b)
5.65
5.55
5.35
5.35
4.76
5.54
5.44
4.61
11-30 En relacin con los datos en el ejercicio 11-7, pruebe la hiptesis de que las dos
varianzas son iguales, empleando a = .01. El resultado de esta prueba influye en
la manera en lacual se conducira una prueba respecto
a las medias? Qu tamao
11-14
EJERCICIOS
401
Muestra 1
Muestra 2
1.87
2.00
2.00
1.85
2.11
2.31
2.28
2.07
1.76
1.91
2.00
4.34
5.00
4.97
4.25
5.55
6.55
6.37
5.55
3.76
Mdquina 1
~
Mdquina 2
n, = 25
n, = 30
X,
X,
=
S: =
.984
13.46
estas
S:
= .907
= 9.65
a)
b)
a = .05.
34
57
65
60
402
Pruebe la hip6tesis de que las dos bolas producen la misma medicidn de dureza.
Emplee a = .05.
11-34 Seis individuos midieron el espesor de una tarjeta de circuito impreso, empleando
dos tipos diferentes de
calibradores. Los resultados (en mm) semuestran a continuaci6n:
Sujeto
,264
1
,265
2
3
,264
,266
4
.267
5
.268
6
Calibrador 1
Calibrador 2
,265
,265
,266
.267
,267
,265
Avi6n
2891
2862
2833
2884
5
2896
286
285
279
283
281
286
283
11-14 EJERCICIOS
403
Sujeto
Cuero
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
de zapatos 1
.o1
.o2
.O3
.o1
.o1
.o1
.o2
.O4
.O5
.O3
.o2
.o1
.O6
.o1
.o1
.O4
Cuero
de
zapatos 2
.02
.04
.03
.01
.04
.06
.o1
.01
.05
.01
.04
.03
.04
.06
.03
.o1
11-42 Dos
CAPfTULO
DE
11 PRUEBAS
404
HIP6TESIS
0 ; se
conocen. El tamalo de muestra total N es fijo, pero la distribucin de las observaciones para las dos poblaciones tales que nl + n2 = N se haril con base en los costos.
Si los costos del muestre0 para las poblaciones 1 y 2 son Cl y C2,respectivamente,
encuentre los tamafios de muestra de costo mnimo que proporcionan una varianza
especificada para la diferencia en las medias de muestra.
11-44 Un fabricante de una nueva pastilla analgksica deseara demostrar que su producto
(T:
11-45 Deduzca una expresin similara la ecuacin 11-20 para el error fl correspondiente
a la prueba en la varianza de
una distribucin normal. Suponga que se especifica la
alternativa de doslados.
11-46 Deduzca una expresin similar a la ecuacin 11-20 para el error fl correspondiente
Nmero de
defectos por da
o- 10
11 - 15
16-20
21 - 25
26 - 30
31 - 35
36 - 40
41 - 45
Veces observadas
6
11
16
28
22
19
11
4
11-14
EJERCICIOS
405
a)
b)
Vehculos
Dor minuto
Veces
observadas
por minuto
Veces observadas
53
54
55
56
57
58
59
60
61
62
63
64
65
102
96
90
81
73
64
61
59
50
42
29
18
15
14
24
57
111
194
256
296
378
250
185
171
150
110
40
41
42
43
44
45
46
47
48
49
50
51
52
967
1008
975
1022
1003
989
1001
981
1043
1011
Segundos
Frecuencia
2.10
2.11
2.12
2.13
16 41 28
a)
82137
256
14974
2.14
2.15 2.16
2.17
2.18
2.19 2.20
40
19
11
""-
406
211.14psi
203.62
188.12
224.39
221.31
204.55
202.21
201.63
226.16 psi
202.20
21 9.54
193.73
208.15
195.45
193.71
200.81
Mquinas
Turno
1
2
3
1641 12
31
15
20
11
17
9
16
14
10
11-14 EJERCICIOS
407
~~
~~
Calificacin
Califimci6n
de
investigaci6n
de
operaciones
A
B
25
6
13
16
17
18
Otra
10
estadstica
de
17
104
8
Otra
15
18
11
20
o- 1.999
2,000-5,999
6,00011,999
6
9
11
14
17
8
4
6
1
2
22
4
46
17
18
6
9
12
120
70
60
40
80
70
60
408
son
Telar
185
1
1
2
3
4
5
12
21 90
16170
158
15185
16
24
35
22
22
11-59 Un
Condicidn
ModernaEstPndar
SubestPndar
Poltica
58
52
Agresiva
Neutra
80
No agresiva
36
11-60
24
86
15
73
17
Captulo 12
Diseo y anlisis
de experimentos de un solo
factor: el anlisis de varianza
Los experimentos son una parte natural del proceso de toma de decisiones de la
ingeniera yla administracin. Por ejemplo, supngase que
un ingeniero civil est
investigando el efecto de mdtodos de curado en la resistencia a la compresin
media del concreto. El experimento consistira
en elaborar varios especmenes de
prueba del concreto empleando cada uno de los mktodos de curado propuestos y
luego probar la resistencia a lacompresin de cada espcimen. Los datos de este
experimento se utilizaran para determinar quC mtodo de curado debeutilizarse
para brindar la resistencia a la compresin
mxima.
Si slo hay dos mtodos de curado de inters, el experimento podra designarse y analizarse utilizando los mtodos del captulo 1 l . Esto es, el experimentador tiene un solo factor de inter& "los mtodos de curado- y stos son
nicamente dos niveles del factor. Si el experimentador estinteresado en determinar qud mtodo de curadoproduce la resistencia compresiva mxima, entonces
el nmero de especmenes para prueba puede determinarse utilizando las curvas
caractersticas de operacin en el diagrama VI del apkndice, y la prueba t puede
usarse para determinar si las dos medias difieren.
Muchos experimentos deun solo factorrequieren ms de dos niveles del factor
que se considerar. Por ejemplo, el ingeniero civil puede tener cinco mtodos de
curado diferentes que investigar. En este captulo presentaremos el anlisis de
varianza para tratar con ms de dos niveles de un solo factor. En el captulo 13,
mostraremos cmo disefiar y analizar experimentos con varios factores.
410
CAPITULO
12
DISENOY
ANALISISDE
EXPERIMENTOS DE UN SOLO FACTOR
Un ejemplo
Concentracibn de
madera
dura
4(%)3 2 1
5
10
15
20
Observaciones
Promedios
Totales
7
8 15
12 17 13
14 18 19
19 25 22
5
11
18
17
23
9 10
19 15
16 18
18 20
60
94
102
127
10.00
15.67
17.00
21.17
383
15.96
41 1
es
41 2
Observaci6nTratamiento
Promedios
Y11
Y12
Y21
Y22
Ya1
ya2
' '
.'.
...
...
...
' ' _
Yln
Y1 .
Y1 .
Y2 n
Y2.
ya"
ya.
v,
COMPLETAMENTEALEATORIO
413
Crl=O
(1 2-2)
1=l
Y,.=
C Y,,
v,.= y , . / n
1 , ~. .,. a
/=1
y..=
cc
11
Y,,
V..=y../N
(1 2-3)
1=1/=1
H,:
r, f.
= r, =
(12-4)
Esto es, si la hipbtesis nula es verdadera, entonces cada observaci6n esta integrada
por la media general p mhs una realizaci6n del error aleatorio E,,,
El procedimiento de prueba para la hip6tesis en la ecuaci6n 12-4 se llama
anlisisde varianza. El termino anhlisis devarianzaresultadepartir
la
variabilidad total en los datos, en sus partes componentes. La suma corregida total
de los cuadrados, que es una medida de la variabilidad total en los datos, puede
escribirse como
414
FACTOR
o bien
I S 1
J=l
r=l j = l
i=l
u
I1
(12-6)
i=l/=1
Ntese que el trmino del producto cruzado en la ecuacin 12-6 es cero, puesto
que
I1
c ( Y , , -Y,.>
I= I
=.Y,.-
G,.=4',.-
.(Y,./d
,=I
/=I
,=1
i = l /=1
La ecuacibn 12-7 muestra que la variabilidad total en los datos, medida por la
suma corregida totalde los cuadrados, puede partirse en la suma delos cuadrados
de diferencias entrelas medias de los tratamientos, las medias grandes y unasuma
de cuadrados de diferencias de observaciones dentro de los tratamientos y la
media del tratamiento. Las diferencias entre
las medias de tratamiento observadas
y la media grande miden
las diferencias entre tratamientos, en tanto que las
diferencias de observaciones dentro de un tratamiento a partir de la media del
tratamiento puede deberseslo a un error aleatorio.En consecuencia, escribimos
la ecuacin 12-7 simbblicamente como
12-1
EXPERIMENTO
SOLO
UN
FACTOR
DE COMPLETAMENTE
ALEATORIO
415
el,
Al emplear este teorema, notamos que los grados de libertad para SStratamientos
y SS, suman N - 1, por lo que SSlratamientos/~2
y SSFJo2son variables aleatorias
independientes con distribucin ji cuadrada. Por tanto, ante la hiptesis nula, la
estadstica
(1 2-8)
sigue la distribucin Fa-I,N-a.
Las cantidades MStralamienlOS
y Mslcse llaman medidas
cuadrhticas.
Los valores esperados de las medias cuadrhticas se utilizan para mostrar que
Fo en la ecuacin 12-8 es una estadstica de prueba apropiada para H,: 2, = O y
para determinar el criterio de rechazo de esta hiptesis nula. Considerese
416
N-a
1=1
Lr=l /=1
- u
r=l\,
"
E ( MS,,)
N-U
I=
7
: - au2
E(MS,)
= fJ2
n
E ( MStratarnientos)
u2 +
7,'
r=l
~
a-1
SS,
It
c c Y;
r=1/=1
Y..
N
(12-9)
417
COMPLETAMENTE ALEATORIO
Suma de
cuadrados
Grados de
libertad
Media
cuadrdtica
-1
MS tratamientos
SS tratamientos
Error (dentro de
los tratamientos)
Total
N-a
N-1
SSE
SST
Fo
FO=
MS tratamientos
MSE
MSE
Y
(12-10)
La suma de los cuadrados del error se obtiene mediante
sustraccih como
SS,
SST -
(12-11)
Sstratarnientos
(60)'
..2
SS,
SST -
Sstratarnientos
24
382.79
4f8
Fuente de
variaci6n
Concentraci6n de
duramadera
Error
Total
23
Suma de
cuadrados
Grados de
libertad
Media
cuadratica
382.79
130.17
51 2.96
3
20
127.60
6.51
FO
Fo = 19.61
L=
e?,=
2
..
I,
,I
r=l j=1
,I
(y,j-
1=1 j = 1
Y-
71
>
(12-12)
Elfi,?,
=
1,2, ..., a
-2
2, e igualar
c c (x,
,=1 j=1
6-t)
a cero, obtenemos
12-1
419
Y
11
-2C(yi,-fi-+,)=o
z = 1 , 2 ,..., a
/=1
+ n+2
= Y2.
n1;
+n+,
(12-13)
= y,,
Las ecuaciones 12-13 se conocen comoecuaciones normales de mnimos cuadrados. Ntese que si sumamos las ltimas a ecuaciones normales obtenemos la
primeraecuacin normal. En consecuencia, las ecuacionesnormalesnoson
linealmente independientes,y no hay estimaciones nicas parap , r,, . . . , 2,. Una
forma de superar esta dificultad
es imponer una restriccin en la solucin paralas
ecuaciones normales. Son muchas las maneras para elegir esta restriccin.Puesto
que hemos definido los efectos de tratamiento como desviaciones de
la media
general, parece razonable aplicarla restriccin
C+=O
U
(12-14)
i=l
r..
+ =j,.-j,,
1 , 2,..., a
(12-15)
420
p,=p+t,
21.17 psi
Un intervalo de confianza de
95 por cientoen la resistencia media a la tensi6n en
madera dura al 20por ciento se encuentra de la ecuaci6n 12- 16 como sigue:
vi.*
I21.17
ta,2. N - o \ j l M s E j n
(2.086)d-]
t21.17 k 2.171
421
p2,,%I
23.34 psi
[.y,.-
.y,.*
fd2,N-u
117.00 - 15.67
pfSE,"]
* (2.086)/-]
/AI=,% - / . L ~ O % I
4.40
422
TABLA 12.5
Concentraci6n de
madera
5%
10%
15%
20%
-3.00
- 3.67
- 3.00
-2.17
2.00
1.33
1 .o0
3.83
5.00
-2.67
2.00
0.83
1.00
2.33
0.00
1.83
1 .o0
-3.33
- 1.00
-3.17
0.00
0.67
1 .o0
-1.17
.
.
.
...
.
..
o
-4
-2
Valor residual
423
Unagrhfica de probabilidadnormalde
los residuos delexperimento de
concentracin de madera dura se muestra en la figura 12.2. Las figuras 12.3 y
12.4 presentan residuos contra el nmero de tratamiento y el valor de ajuste Ti.
Estas grhficas no revelan ninguna inadecuacin del modelo o problema inusual
respecto a las suposiciones.
Figura 12.4
y,.
424
CAPiTULO 12
x,
nc
y'
SS, =
;=I j = 1
lJ
Y..
N
425
= P4
HI: P3 + P4
Esta hip6tesis podra probarse utilizando una combinaci6n lineal de totales de
tratamiento, por ejemplo
Y3.-
y,.=
Ho: P1 + 113 = P2 + P4
H , : P l + 113 # P2 + P4
Y3.- Y2.-
y4.=
r=l
(12-18)
SS, =
c:
1
I=
(12-19)
426
CAPITULO
12 DISEO
ANALISIS
c,d,= O
r=l
o, en su disefio desbalanceado, si
1n,c,d, = O
U
/=1
1 (control)
2 (nivel 1)
3 (nivel 2)
Contrastes Ortogonales
-2
1
1
O
-1
.51
427
C2= - 3(60)
C 2 3 = - 60
94
( - 9)'
+ 127 = -9
SS,, = -- 3.38
6(4)
(209)
SSc,
= --
SSc,
= --
364.00
6(20)
(43)2
15.41
6(20)
Media
Grados
de
Suma
de
Fuente de variaci6n
cuadrados
libertad
cuadratica
Concentraci6n
madera
durade
(1,4vs.
(3.38)
2,3)
(1,2vs. 3,4)
(1,3vs.(15.41)
2,4)
Error
20
Total 23
c,
c,
c,
Fo
382.79
(364.00)
(1)
(11
(1)
130.17
512.96
127.60
19.61
0.52
3.38
364.00
55.91
2.37
15.41
428
nes usando los mismos datos. Por ejemplo, los analistas pueden desear probar
todos los pares posibles de medias. La hipbtesis nula sera entonces Ho:p , = pj,
para toda i # j . Si probamos todos los pares posibles de medias empleando
pruebas de t, la probabilidad del error de tipo I para el conjunto completo de
comparaciones puede incrementarse en forma Considerable. Hay varios procedimientos disponibles que evitan este problema. Entre los ms populares estn la
prueba de Newman-Keuls [Newman (1939); Keuls (1952)], la prueba de Tukey
[Tukey (1953)], y la prueba de intervalo mltiple de Duncan [Duncan (1955)l.
Aqu describimos laprueba de intervalo mltiple de Duncan.
Paraaplicarlapruebadeintervalo
mltiple de Duncan para tamafos de
muestra iguales, lasa medias de tratamiento se arreglan en orden descendente, y
el error estndar de cadamedia se determina como
( 12-20)
De la tabla de Duncan de intervalos significativos (tabla VI1 del apndice), se
obtienen los valores R,( p , f ), para p = 2, 3 , . . . , a, donde a es el nivel de
significancia y f es el nmero de grados de libertad para el error. ConviCrtanse
estos intervalos en un conjunto de a - 1 intervalos significativos menores (esto
es, RJ, parap = 2, 3, . . . ,a, calculando
R,
2 , 3 , . .., u
Luego, se prueban los intervalos observados entre las medias, empezando con el
mas grande contra el ms pequefio, lo cual se comparara con el intervalo menos
Significativo R,. Despus, el intervalo del ms grande y el segundoms peque0
se calculan y comparan con el intervalo menos significativo R, - I . Estas
comparaciones se continan hasta que todas las medias hayan sido comparadas
con la media ms grande. El intervalo de la segunda media ms grande y de la
ms pequefia se calculan y comparan luego contra el intervalo
menos significativo
R,- ,. Este proceso contina hasta que los intervalos de todos los posibles a(a 1)/2 pares de medias se
han considerado. Si un intervalo observado es ms grande
que el intervalo significativocorrespondiente ms pequeilo, concluimos entonces
que el par de medias en cuestin es significativamente diferente. Para evitar
contradicciones, no se consideran significativas las diferencias entre un par de
medias si las dos involucradas caen entre otras dos medias que no difieran de
manera considerable.
Ejemplo 12.4 Aplicaremos la prueba de intervalo mltiple de Duncan al experimento de concentracin de madera dura. Recurdese que hay a = 4 medias, n =
6, y MS, = 6.5 l . Las medias de tratamiento presentadas en orden ascendente son
429
VI.=
10.00 psi
m m
R,
3.07
21.17
4 vs. 2
4 vs. 3
21.17
10.00
3 vs. 2
17.00 - 15.67
2 vs. 1 = 15.67
De este anlisis, vemos que hay diferencias significativas entre todos los pares
de medias con excepcin de 2 y 3. Esto implica que las concentraciones de madera
dura de 10 y 15 por ciento producen aproximadamente la misma resistencia a la
tensin, y quetodos los otros niveles de concentracin probados producen
diferentes resistencias a la tensin. A menudo es til dibujar una grfica de las
medias de tratamiento, tal como en la figura 12.5, subrayando las medias que no
son diferentes. Esta grfica revela claramente los resultados del experimento.
Ntese que la madera dura al 20 por ciento produce la mxima resistencia a la
tensin.
5%
10% 15%
20%
430
1 , 2 , ..., a
1 , 2 , ..., n
(12-21)
donde z, y
sonvariablesaleatorias independientes. Ntese que el modeloes
idtntico enestructura al caso de efectos
fijos, pero que los parametros tienen una
interpretacindiferente. Si la varianza de
es
entoncesla varianza de
cualquier observacin es
e,
V(yJ
u,'
+ u2
H,: u,'
' Lasuposicih de que las (1;)son variables aleatorias independientes implica que
l a suposicin usual
de que Zp= I T, = O del modelo de efectos fijos no corresponde al modelo de efectos aleatorios.
431
Si aZ, = O, todos los tratamientos son idknticos; pero si o: > O, entonces hay
variabilidad entre tratamientos.S S E / dse distribuye comoji cuadrada conN a
grados de libertad,y bajo la hip6tesis nulaSS~ammientos/o
se distribuye comouna
ji cuadrada con a 1 grados de libertad. Ambas variables aleatorias son independientes. De tal modo, bajo la hip6tesis nula,
el cociente
SStrrUmientos
a-1
- Mstraumientos
(12-23)
SS,
MSE
N - a
se distribuye como F con a 1 y N - a grados de libertad. Al examinar los
cuadrados de la media esperados podemos determinar
la regi6n critica para esta
estadstica.
Considdrese
Fo =
E ( MStratamiento ) = a 2 + no,'
(12-24)
E ( M S , ) = u2
(12-25)
De loscuadradosmediosesperados,vemosque
si Ho es verdaderatantoel
numerador comoel denominador de la estadistica de prueba, ecuaci6n 12-23,
son
432
CAPITULO12
DISENO Y
El procedimiento de clculo
y el anlisis de la tabla de varianzaelpara
modelo
de efectos aleatorios son idCnticos al caso de efectosfijos. Las conclusiones, sin
embargo, son bastante diferentes debido a que ellos se aplican a la poblacin
completa de tratamientos.
Es usual que necesitemos estimar las componentes de varianza (o2y o:)en
el modelo. El procedimiento utilizado paraestimar oy o: se llama el mtodo
del analisis de varianza, debido a que utiliza
las lneas en el anlisis de la tabla
de varianza. No requiere la suposicin de normalidad en las observaciones. El
procedimiento consiste en igualar los cuadrados de la media esperados con su
valor observado en el anlisis de la tabla de
varianza, y en resolver con respecto
a las componentes de la varianza. Cuando se igualan los cuadrados de la media
observados y esperados enun modelo de efectos aleatorios de clasificacin
en un
sentido, obtenemos
MStratamiento
(J
+ nu,
Y
MS,
= (J2
MS,
(1 2-26)
Y
(12-27)
433
1
2
3
4
98
99
91
93
97
99
4 2
97
90
95
96
Total
3
96
32
95
388
97.5
91.5
95.8
97.0
390
366
383
98
95.4
Promedio
1527
Suma de
Grados de
cuadradoscuadratica
libertad
9
89.1
1.9022.75
111.94
315.68
12
15
Media
Fr
29.73
434
6.96
8.86
+ 1.90
m=
80
85
90
LS L
95
1O0110
105
psi
0)
LS L
b)
435
Y I
Bloque 2
Bloque 3
Y12
Ylh
Y22
Y2h
Y32
Ylh
Ya,
Yoh
CAPITULO
436
1 2 DISENOY
una extensi6n de la prueba t en pares para disefiar situaciones en las que el factor
de inters tiene mhs de dos niveles.
Comoejemplo, supongamos que deseamos comparar el efectodecuatro
compuestos qumicos diferentes sobre la resistencia de una fibra particular. Se
sabe queelefectodeestoscompuestos
vara de modo considerablede un
espcimen de fibra a otro. En este ejemplo, tenemos s610 un factor, el tipo de
qumico usado. Por consiguiente, podramos seleccionar varios pedazos de fibra
y comparar los cuatro compuestos qumicos dentro de las condiciones relativamente homogneasbrindadas por cada pedazo de fibra. Esto eliminara cualquier
variaci6n debida a ella.
El procedimiento general para un disefio de bloque completamente aleatorio
consiste en seleccionar b bloques y en ejecutar una rdplica completa del experimento en cada bloque. Un disefio de bloque completamente aleatorizado para
investigar un solo factor con a niveles aparecera como en la figura 12.7. Habr
a observaciones (una por nivel del factor) en cada bloque, y el orden en el cual
estas observaciones se ejecutan,se asigna al azar dentro del bloque.
Describiremos ahorael anlisis estadsticopara un diseiio de bloque aleatorio.
Supngase quees deinter& un solo factorcon a niveles, y que el experimentose
muestra en la figura 12.7. Las observaciones pueden
ejecuta enb bloques, como se
representarse por medio de un modelo estadstico lineal.
(12-28)
H,:
H,:
rrf
.. .
7"
O al menos una i
r=l
1)
,=1
( Y , , - YJ2
I7
c [(kI...)
+
(I../
r=l , = I
-Y..>+ ( Y , , - j r . - J . , +.?..)I2
(12-29)
437
Fuente de
variaci6n
Tratamientos
a
~
/=
Bloques
,=I
Error
a- 1
a-1
Y.:
b-1
b- 1
(a - l ) ( b -
c CY;-%Y.:
a
MSE
Ssbloques
ab
SSE (por
sustracci6n)
Total
Fo
SStratamientos
MStratarnientos
Y:.
Y.'
- b
ab
EL"
Y.'
Media
cuadratica
Grados de
libertad
Suma de
cuadrados
ab
')
SS,
(a - l ) ( b - 1)
/=1/=1
/=1
/=1
r=l
/=1
c c (Y/j
- y./ -
Y,.+ Y..)2
(12-30)
o, simblicamente,
+ ( h - 1) + ( u - 1)(6 - 1)
(12-32)
438
TABLA 12.10
de
comouesto
3
2
qumico
1
2
3
3.9 4
1 )I
de bloque aleatorio
Totales de Promedios
rengl6n
de
rengldn
Muestra de fibra
'
0.5
0.4
0.6
2.0
1.6
2.4
1.7
4.4
Totaleade
columnagj
9.2 3.5
10.1
Promedios d e
columnaj;i 1.90
2.20
0.88
2.53
2.30
Y,
- 5
Y,.
1.2
2.0
1.5
4.1
1.1
1.8
1.3
3.4
5.7
8.8
6.9
17.8
1.14
1.76
1.38
3.56
8.8
7.6
39.2
1.96
1
1.3
2.2
1.8
(y,)
(Y..)
SS,;
(5.7)'
(9.2)l
(39.2)2
20
-____
= 18.04
= SS, =
SSbloques
25.69 - 6.69
6.69
SStratamientos
18.O4
0.96
439
Tipos de compuestos
(tratamientos)
qumicos
Muestra de fibra
(bloques)
Error
12
Total
18.04
75.1 6.01
6.69
0.96
25.69
1.67
0.08
19
440
En el nivel a = .O5 con 12 grados de libertad del error, los intervalos menos
significativos deDuncan se encuentran a partir de la tablaXI1 del apendice como
(3,12)=
3.23 y r,o5(4,12) = 3.33. De tal modo los intervalos
~ , ~ ~ ( 2 ,=1 3.08,~05
2)
crticos son
R,
0.40
R,
SF,r,05(3,12)= (0.13)(3.23)
0.42
R,
SF,,r,05(4,12)= (0.13)(3.33)
0.43
3.56 - 1.14
J3.=
= j4,- y2.=
La figura 12.8 presenta los resultados en forma grhfica. Los pares de medias
subrayados no son diferentes. La prueba de Duncan indica que el tipo de
compuesto qumico 4 produce resistencias bastante diferentes que los otros
tres tipos. Los tipos de compuesto qumico 2 y 3 no difieren, y lo mismo ocurre
con los tipos 1 y 3. Es posible que haya una pequefia diferencia en la resistencia
entre los tipos 1 y 2.
12-4.3 Anzilisis residual y verificacibn del modelo
- 91)
A, =
jt.+
Y./- y..
(12-33)
12-4
441
1 3
i,
1 . 1
Tipo de compuesto
qumico
1
2
3
4
Muestra de fibra
3
-0.18
0.1o
0.08
0.00
- 0.1 1
0.07
- 0.24
0.27
0.44
-0.18
0.02
0.1o
- 0.02
- 0.1 o
- 0.27
o.O0
0.30
- 0.12
- 0.48
0.30
2-
8
1 -
-Qm
E
.-
0-
-I1
u1
2
-1
e
e
-2 1
I
-0.50
I
-0.25
1
O
0.25
I
0.50
Valor residual
442
0.5
-0.5
Figura 12.10 Residuos por tratamiento
0.5 r
-0.5 L
Figura 12.11
-0.5
Figura 12.12
Residuoscontra y,,
443
(12-34)
Para evaluareste enunciado de probabilidad,necesitamos conocer la distribucibn
de laestadstica que pruebaFo si la hiptesis nula es falsa. Puede demostrarse que
si Ho es falsa, la estadstica F, = MSt,,t,,i,,t,,/MSE se distribuye comouna variable
aleatoria F no central, con a - 1 y N - a grados de libertad y un parmetro de no
centralidad 6. Si 6 = O entonces la distribucin F no central se vuelve la usual
distribucin F central.
Las curvas caractersticas de operacin en el diagrama VI1 del apndice se
usan para calcular la capacidad de la prueba en el modelo de efectos fijos. Estas
curvas grafican la probabilidad del error de tipo I1 ( p ) contra a, donde
U
n
@Z =
r,2
r=l
aa2
(12-35)
El parmetro
se relaciona con el parmetro 6 de no centralidad. Se disponen
las curvas para a = .O5 y a = .O1 y para varios valores de grados de libertad
respecto al numerador y el denominador. En un disefio completamente aleatorio,
el smbolo n en la ecuacin 12-35 es el nmero de rplicas. En un disefio de
bloques aleatorios, se sustituye n por el nmero de bloques.
Al emplear las curvas caractersticas de operacin, debemos definir la diferencia en las medias que deseamos detectar en trminos de Z I= I 2:. Adems, la
varianza a2 del error suele desconocerse. En tales casos, debemos elegir cocientes
de Z
z:/02 que deseemos detectar. De manera alternativa, si se cuenta con una
444
4
5
6
(P2
5
6
Q,
a ( n - 1)
/3
2.00
2.24
2.45
15
20
.38
25
.18
.O6
Potencia(1
8)
.62
.82
.94
445
12-6 RESUMEN
{m
=
2.646
-I
= 4,
N - a = 25 grados de
p = .20
Por tanto, la capacidad es aproximadamente .80.
12-6
Resumen
446
12-7 Ejercicios
12-1 En Design and Analysis offiperiments, 2a. edicin (John Wiley & Sons, 1984), D.
C. Montgomery describe un experimento en elcual la resistencia a latensin de una
fibra sinttica es deinters al fabricante. Se sospecha quela resistencia se relaciona
con el porcentaje de algodnen la fibra. Se emplean cinco niveles de porcentaje de
algodn, y se ejecutan cinco rplicasen orden aleatorio, que dan como resultado
los
datos siguientes.
Observaciones
Porcentaje
3 de algoddn
2
15
20
25
30
35
12
a)
6)
c)
S)
7
17
18
25
10
14
18
19
7
9 15
18
12
19
23
22
11
11
11
18
19
19
15
12-2 En Orthogonal Design for Process Optimization and Its Application to Plasma
Etching (SolidState Technology, mayo de 1987), G. Z. Yin y D. W. Jillie describen
un experimento para determinar el efecto de la tasa de
flujo de CzF6 sobre la
uniformidad del grabado en una oblea de silicio empleadoen la manufactura deun
circuito integrado. Se utilizan tres tasas de flujo en el experimento, y la uniformidad
en seguida.
resultante (en porcentaje) para seis rplicas se muestra
Flujo de c2F6
(SCCM)
2
125
160 4.6
200
a)
b)
Observaciones
1
2.7
4.9
4.6
4.6
3.4
2.6
5.0
2.9
3.0
4.2
4.2
3.5
3.2
3.6
4.1
3.8
5.1
La tasa de flujo de
C2F6afecta launiformidad del grabado? Construya grficas
de caja para compararlos niveles del factory efectuar el anlisis devarianza.
Los residuos indican algn problema con las suposiciones bsicas?
12-7 EJERCICIOS
447
mezclado
1
2
29
3
4
3000
3300
2900
2700
31
3200
2800
2600
2890
3150
3050
2765
2865
2975
2985
2600
a)
12-4 Una fbrica de hilados tieneun gran nmero de telares. Se supone que cada uno de
los telares proporciona la misma salida de tela por minuto. Para investigar esta
1
2
3
4
5
Salida (Iblmjn)
4.0
3.9
4.1
3.6
3.8
4.1
3.8
4.2
3.8
3.6
4.2
3.9
4.1
4.0
3.9
4.0
4.0
4.0
3.9
3.8
4.1
4.0
3.9
3.7
4.0
a)
(OF)
1 O0
21.5
21.5
21.4
21.7
125
150
175
21.8
21.9
21.7
21.6
21.7
21.5
21.8
-
21.9
21.8
21.6
21.5
21.8
21.6
21.7
21.8
21.7
21.9
448
a)
FACTOR
b) Estimea
lscomponentes en el modelo.
c ) Analice los residuos del experimento.
12-6 Un ingeniero en electr6nica est& interesado en el efecto de la conductividad de cinco
1
2
3
4
5
141
1 49
133
127
148
143
152
134
129
147
150
137
132
132
144
146
143
127
129
142
1
2
3
a)
19
20
16 18
22
2.1
15
20 25
33 40
17
18
27
26
Pruebe la hip6tesis de que los tres tipos de circuito tienen el mismo tiempo de
respuesta.
b ) EmpleelapruebadeintervalomltipledeDuncanparacompararparesde
medias de tratamiento.
C)
Construya un conjunto de contrastes ortogonales, suponiendo que al principio
del experimento usted sospecha que el tiempo de respuesta del circuito tipo
2
sera diferente de los otros dos.
449
12-7 EJERCICIOS
d) ~ C u h es
l la capacidad de esta prueba para detectara;= ,z?/a2 = 3.0?
e ) Analice los residuos de este experimento.
12-8 En The effect of Nozzle Design on the Stability and Performance of Turbulent
Water Jets (Fire Safety Journal, vol. 4, agosto 1981), C. Theobald describe un
.80
.85
.92
.97
.86
16.59
20.43
28.74
23.46
.81
.92
.95
.98
.78
.75
.86
.89
.88
.76
.77
.81
.89
.86
.76
.78
.83
.83
.83
.75
a)
Eltipodeboquillasafectaelfactordeforma?Comparelasboquillascon
grhficas de caja y el anhlisis de varianza.
b ) Emplee la prueba de intervalo mltiple de Duncan para determinar las diferencias especficas entre las boquillas. Una grhfica del factor de forma promedio
(o la desviacibnesthdar) contra el tipo de boquilla ayuda en las conclusiones?
c ) Analice los residuos de este experimento.
12-9 En su libro Designs and Analysis of Experiments, 2a. edicibn (John Wiley& Sons,
1984), D. C. Montgomery describe un experimento para determinar el efecto de
Tipo de
2punta
19.4
9.3
2
3 9.7
4
a)
Espbcimen
1
9.3
9.4
9.2
9.5
9.7
9.4
9.6
9.6
9.8
10.0
9.9
10.0
10.2
CAPITULO 12 DISEO Y
450
ANALISIS
DE
EXPERIMENTOS
DE UN
SOLO
FACTOR
cincopoblacionesnormalestienenvarianza
comn
= 100 y
medias pl = 175, p 2 = 190, p 3 = 160, p4 = 200 y p5 = 2 15. Cuntas observaciones
por poblacin deben tomarse de modo quela probabilidad de rechazar la hiptesis
de igualdad de medias seapor lo menos de .95? Emplee a = .Ol.
p= In,c:.
a,
los cuatrotratamiento.Sean
y
componentesde un solo gradode libertad
=
+ & + &.
para los contrastes ortogonales.Demuestre que SStratamientOS
12-15 Considere los datos que se muestcan en el ejercicio 12-7.
u) Escriba en forma completa a
ls ecuaciones normales de mnimos cuadrados para
(X;=
b)
c)
Captulo 13
Diseo de experimentos
con varios factores
Un experimento no es ms que una prueba o una serie de pruebas. Los experimentos se realizan en todas
las disciplinas cientficas y de ingeniera,
la
y sonuna
parte fundamental del proceso de descubrimiento
y aprendizaje. Las conclusiones
quepuedenextraersedeunexperimento
dependeritn, en parte, dec6mo se
condujo y por ello su diseo desempefa un papel principal en la soluci6n del
problema. Este captulo presentatdcnicas de diseo de experimentos tilescuando estn involucrados varios factores.
452
-t
Proceso (Maquina
de soldadura de flujo)
21
22
Salida
(defectos,y)
=Y
6. Tasa de produccibn
Con frecuencia, los factores incontrolables se denominan factores de ruido.
Una representacibn esquemdtica del proceso se muestra en la
figura 13. l .
En esta situaci6n el ingeniero est interesado en caracterizar la mquina de
soldadura de flujo; estoes, 61 seinteresa en determinarque factores (tanto
controlables como incontrolables)
afectan la ocurrencia de defectos
en las tarjetas
decircuitoimpreso.Para
lograr esto, se puede disefiar un experimentoque
permitird estimar la magnitudy direcci6n de los efectosdel factor. En ocasiones
llamaremos a un experimento de estas caractersticas experimento de encubrimiento. Lainformacibnde este estudiode caracterizacibn o experimento de
13-1
453
20c
19(
Trayectoria que conduce ala
regidn de rendimientom8s alto
18C
-S
17C
160
Condiciones de la
Corriente de operaci6n
\I
1 50
140
0.5
1.0
1.5
2.0
2.5
Tiempo (hr)
~-
..~.
454
Modificaciones de procesos
Desarrollo y optimizacin de procesos
Evaluacin de alternativas de materiales
Pruebas de confiabilidad y vida de servicio
Pruebas de funcionamiento
Configuracin del disefio del producto
Determinacin de la tolerancia de componentes
455
13-2 EXPERIMENTOSFACTORIALES
Factor B
Factor A
B,
8,
10
20
40
30
+ 40
10
+ 20
- 20
Esto es, el cambio del factor A del nivel 1 al nivel 2 ocasiona un incremento en
la respuesta promedio de 20 unidades. De modo similar, el efecto principal de B
es
20
+ 40
10
+ 30
30 - 10
20
Puesto que el efecto de A depende del nivel elegido para el factor B, hay una
interaccin entreA y B.
Cuando una interaccin es grande, los efectos principales correspondientes
tienen poca importancia. Por ejemplo, empleando los datosde la tabla 13.2,
encontramos el efecto principal deA como
30
A=---
+O
2
10
+ 20
2
=o
Factor B
Factor A
B,
B.?
A,
10
30
20
A2
456
50
I
Al
Factor A
A2
50
L
Al
Factor A
A2
con
13-2 EXPERIMENTOSFACTORIALES
457
0.5
1 .o
1.5
u
2.0
2.5
Tiempo (hr)
de reacci6ncon
I
u
140
150
160
1
170
180
Temperatura (OF)
458
0.5
1.0
1.5
2.0
2.5
Tiempo (hr)
459
+ 7, + b, +
i = 1.2, ..., a
j = 1 . 2 ,..., b
k = 1 . 2 ,..., n
(13-1)
donde p es el efecto de la media general, 7 , es el efecto del nivel isimo del factor
A , p/ es el efectodel niveljsimo del factor B, (T
es el efecto de la interaccin
entre A y B y ,it es una componente de error aleatorio NID (O, 02).
Estamos
interesados en probar la hiptesis de ningn efecto significativo del factor A ,
ningn efecto significativo del factor B, y ninguna interaccin significativa AB.
m,,
CAP~TULO13
460
DISENO DE EXPERIMENTOS
CON
VARlOS FACTORES
Como con los experimentos de un solo factor del capitulo 12, el anlisis de
varianza ser empleado para probar estas hiptesis. Puesto que hay dos factores
bajo estudio,el procedimiento quese emplea se llama anlisis de varianza en dos
sentidos.
13-3.1 Anhlisis estadstico del modelo de efectos fijos
Sup6ngase que los factores A y B son fijos. Esto es, los niveles a del factor A y
los nivelesb del factorB son elegidos en forma especifica por el experimentador,
y las deducciones seconfinan s610 a estosniveles. En este modelo, es usual definir
los efectos zi, /3/ y
como desviaciones respecto a la media, de manera que
b
z;=,2,
= o, xj=,fi=o,z f = , ( z & = o y
x;,, (zp),=O.
Sea yi el total de las observaciones bajo el nivel isimo del factor A , y,/.,el
total de las observaciones bajo el nivel jsimo del factor B, y,j, el total de las
observaciones enla celda ijsima
de latabla 13.3, yy... como el gran total de todas
" las observaciones. Definase y , ,y,, yli y y como el rengln, la columna, la celda
y los grandes promedios correspondientes. Esto es,
,
as
461
r=l
/=I
h=l
c c c [(Y,..-
/ =, I= I
h=l
Y...). +
(j?,.-
Y...)
2
U
hn
c (vf..- K I 2
/=
+(Yf/.-~r..-v.,.j...)
h
11
(jr/.-
r = l /=1
+ an
(Y/,k
-jij.)]
c (J.,.-Y...)2
j= 1
v...)+
ji..-J.,.+
!l
(Yfjh
/=l j=1 k = l
- j i j . ) 2 (l3-3)
u-1
b
E( MS,,)
( u - l ) ( h - 1)
n
=
u2
c c (TP)?,
r=l i = 1
(u
- 1)(6 - 1)
CAPTULO 13 EXPERIMENTOS
DISEA0
DE
CON
462
VARIOS FACTORES
Suma de
cuadrados
Grados de
libertad
Tratamientos A
SS,
a- 1
Tratamientos 6
SS,
b-1
lnteraccidn
SS,,
Media
cuadratica
SS,,
(a - l)(b - 1)
Fo
F
O
MSAB
-.
MSE
Error
Total
SST
abn - 1
E(MS,)
SS,
a b ( n - 1)
= O2
11
(13-5)
c"-Y;..
u
1-1
bn
Y2
(13-6)
abn
Y
SSB =
x---
j=l
Y.;,.
an
Y...
abn
(13-7)
13-3 EXPERIMENTOS
FACTORIALES
DE DOS FACTORES
463
Esta suma de cuadrados contienetambidn SS, y SS,,. Por tanto, el segundo paso
es calcular SSABcomo
(1 3-8)
(13-9h)
MBtodo de aplicaci6n
Y!,.
Tipo de tapaporos
Rociado Ban0
4.0,4.5,4.3
5.4,4.9,5.6
28.7
5.6,
5.8,6.1,6.3
34.1
3.8,3.7,
5.5,5.0,5.0
27.0
4.9,
5.4
4.0
_____Y.,.
49.6 40.2
89.8= y,,.
CAPlTULO 13 DlSEk'O
EXPERIMENTOS
DE
464
SS,
y&
i = l J-1 k = l
(4.0)2 + (4.5)2 +
i"2
i-l
Y,..
bn
(28.7)2
(89.8)2
18
10.72
Y...
abn
+ (34.1)2 + (27.0)2(89.8)2
"6
18
- (40.2)2 + (49.6)2(89.8)2
-
"=
18
- 4.58
4.91
-"
(89.8)2
18
Fuente de
variaci6n
Tipos de tapaporos
Metodos de aplicaci6n
Interacci6n
Error
17
Total
Suma de
cuadrados
Grados de
libertad
Media
cuadrhtica
4.58
4.91
.24
2
1
2
12
2.29
28.63
4.91
.12
61.38
1.5
.99
10.72
.08
Fo
13-3
465
2
Tipo de tapaporo
.. ~
"
"
"
"
"
- y $J.
..
CAPTULO 13 DISEA0
DE
466
MBtodo de aplicacibn
de
Tipo
1
2
3
Rociado
0.1O, - 0.40, 0.30
- 0.27,
0.23,
0.03
0.30,- 0.40,0.1O
- 0.03.- 0.13.0.17
2.0.
1.0
-0.27,0.30, 0.23
0.33.-0.17. -0.17
I ,
e *
zj
0.0
t
-1
.o -
-2.0
'
-.5
I
-.3
-.
1
1
+. 1
1
+.3
eqk, Residuo
-151
467
MBdo de aplicaci6n
eijk
O')
04
O
.o
O
.o
. ..
5
I.
.
.
y qk
.o
-.5
En algunoscasosque
involucran un experimento factorial dedosfactores,
podemos tener slo una rkplica. Esto es, s610 una observaci6n por celda.En esta
situacin hay exactamente tantos parhmetros en el modelo del
anhlisis de varianza
468
como observaciones, ylos grados de libertad del errorson cero. Por consiguiente,
no esposible probar hip6tesis en torno a los efectos einteracciones principales a
menos que se haga una suposicih adicional. La suposicibn usual es ignorar el
efecto de interaccih y usar la media cuadrhtica de interacci6n como un error
medio cuadrhtico. De tal modo el anlisis es equivalente al
empleado en el disefio
de buque aleatorizado. Esta suposici6n de no interacci6n puede ser peligrosa, y
el experimentador debe examinar cuidadosamente los datos y los residuos como
indicadoresdequeah
realmente esta presente la interaccibn. Para mayores
detalles, vease Montgomery (1984).
13-3.4 Modelo de efectos aleatorios
Hasta ahora hemos considerado el caso en que A y B son factores fijos. Consideraremos ahora la situaci6nen la cual los niveles deambos factores se seleccionan
al azar a partir de poblaciones mhs grandes de niveles del factor, y deseamos
extender nuestras conclusiones a la poblacidn muestreada de niveles del factor.
Las observaciones se representan por medio del modelo
yijk = p
+ + pj + (
1,2,...7a
~ p+ )c i j ~k j~= l,2,...7b
T~
(13-10)
1 , 2 , ..., n
donde los pariimetros -ri, 4, (-rp)li y Eijk son variables aleatorias. Especficamente,
es
otS)y eijk es
suponemos que -ri es NID(0, a:), p, es NID(0, o;),( ~ p ) ~ .NID(0,
NID(0, a2).La varianza decualquier observacidn es
+ us + u; + u 2
V ( Y i i k )= u,
y 0 %0%( ~ : ~o*
y se llaman componentes de varianza. Las hip6tesis que estamos
interesados en probar son H,: oZ,= O, H,: a i = O y H,:
= O. Adviertase la
,similitud con el modelo de efectos aleatorios de clasificaci6n en un sentido.
El anlisis de varianza bhsico permanece sin cambio; esto es, SS,, SS,, SSAB,
SST y SSE se calculan todos como en el caso de efectos fijos. Para construir las
estadisticas de prueba,debemos examinar las medias cuadriiticas esperadas. Ellas
son
+ nu; + bnu,?
= u 2 + nu; + anus
E ( M S A ) = u
E(MS,)
E(Ms,,)
u2
+ nu;
Y
E(MS,)
u2
(13-11)
469
Fo = -
(13-12)
puestoquebajo
Ho tanto el numerador comoeldenominadorde
Fo tienen
esperanza d,y s610 si Ho es falsa E(MSAB)es m& grande que E(MSE).La raz6n
Fo se distribuye como F(a - (b - I), ab(,, - De manera similar, para probar Ho:
oZ,= O usaramos
(13-13)
que se distribuye como Fa - I ,
(a
06
= O la estadstica es
(13-14)
la cual se distribuye como Fb - (a - ,) ( b - I ) . Todas Cstas son pruebas de una cola
superior. Nbtese que estas estadsticas de prueba
no son las mismas que las
utilizadas si ambosfactores A y B son fijos. Las medias cuadrhticas esperadas se
emplean siempre comouna gua para probar la construcci6n de la estadstica.
Las componentes devarianza pueden estimarse igualando las medias cuadrhticas esperadas con susvalores esperados y resolviendo para las componentes de
varianza. Lo anterior produce
s2 = M S ,
Fuente de
variaci6n
Suma de
cuadrados
Tipos de tapaporos
2
MBtodos de aplicaci6n
Interacci6n
.12
Error 12
Total
17
4.58
4.91
.24
.99
10.72
Grados de
libertad
40.92
1
2
Media
cuadrhtica
Fo
4.91
1.5
.O8
470
(13-15)
84 =
6
;
6;
G2 = .O8
.12 - .O8
=
3
2.29 - .12
6
4.91 - .12
.O133
.36
= .53
Claramente, las dos componentes de varianza mas grandes son para los t i p s de
tapaporos ( 6 ;= .36) y los mktodos de aplicaci6n (68 = S3).
13-3.5 Modelo mixto
1 , 2 , ..., a
y l j k = ~ + + l + p , + ( + p ) l , + , j ~j = 1 , 2 , . . . , b
(13-16)
1 , 2 , ..., n
13-3
411
aleatorio NID(0, o '). Suele suponerse quepi es NID(0, 03) y que los elementos
de interacci6n (z& son variables aleatorias normales con media cero y varianza
[(a- l)/a] o:pLos elementos de interaccih noson todos independientes.
Las medias cuadrhticas esperadas son en este caso
+ a i-= 11
= u 2 + ana;
= u 2 + nu$
E ( M S A )= u 2 + nu$
E(MS,)
E(Ms,,)
Y
(13-17)
E ( M S , ) = u2
F,
(13-18)
MSAB
(a
(b -
(13-19)
quesedistribuyecomo
utilizaramos
Fb -
I , ab(fl
(13-20)
que se distribuye como F(a- (6 - ab(n - I).
Las componentes de varianza o$,o:sy o pueden estimarse eliminando la
primera ecuaci6n de la ecuaci6n 13-17, dejando tres ecuaciones con tres inc6gnitas, cuya soluci6n es
MSB - MSE
; =
an
M S A B - MSE
=
n
'
3
l;
Y
2 = M S ,
(13-21)
472
Fuente de
variaci6n
Renglones (A)
Columnas (B)
Interacci6n
Error
Total
Suma de
cuadrados
SS*
SS,
SS,,
SS,
SS,
Grados de
libertad
a- 1
b-1
(a - l)(b - 1 )
ab(n - 1)
abn - 1
Media
cuadrhtica
o2
Fo
+ nu$j + bnXT2 / ( a - I )
u2 + ano2
2 + no,/,2/'
U2
+ (TPY)l,k + Ilk/
( i = 1,2, ..., a
j = 1,2, ..., b
1 , 2 , ..., c
(13-22)
13-4
EXPERIMENTOS
GENERALES
FACTORIALES
TABLA 13.1O
tres factores
%ente de Suma de
variacidn cuadrados
AB
SSAB
AC
473
Media
cuadratica
a- 1
MS,
6'
+a- 1
b- 1
MS,
a2
c-1
MS,
a'+
( a - l)(b - 1)
MS,
a2
(a - l)(c - 1)
BC
BC
Medias cuadraticas
esperadas
Grados de
libertad
(b - I)(c
MS
,,
1)
ABC
SS,,,
(a - l)(b - l)(c
Error
Total
SS,
SS T
abc(n
MSE- 1)
abcn - 1
bcnE.7,'
1)
acnE.8:
b-1
abnEy$
c- 1
+
+
U'
MSBC
a2
MSABc
a2
cnxx(rp)g
(a - l ) ( b
1)
bn-LE(.ru):k
(a - l)(c - 1)
anxx(py);
(b - l)(CMSE 1)
nEEE(rPv),?,
- l)(c - 1)
(a - l)(b
MSA,
fo= __
MS,
MSAC
f , = ___
MSE
f, =
MsBC
~
MsABC
F, = ___
MSE
a'
t=1
bcn
abcn
como sigue:
C-""Y,. ..
h
Y . ...
(13-24)
Y .J..
acn
Y ....
-
X=l
abn
abcn
--
SS,=
SS,=
. k.)
(13-25)
abcn
Y ....
1 Y..X.
-- -
(13-26)
Para calcular las sumas de cuadrados de interacci6n de dos factores, los totales
para las celdasA X B, A X C y B X C son necesarios. Puede ser til descomponer
la tabla de datos originalen tres tablasde dos sentidoscon el fin de calcular estos
totales. Las sumas de cuadrados son
o
SS,,
VI,..
v2
-
- SS,
SS,
r=l,=l
(13-27)
474
SS,,=
k=l
bn
abcn
Y1.k.
Y....
-- SS,
= SSsubtotales(AC)
Y
=
/=1 h = l
Y?..
an
= SSsubtotales(BC)
(13-28)
- "C
Y2,L
SS.,
- SS,
--
ubcn
-
SS,
SS[
(13-29)
SS, -k SS,
SS,
SS,,
SSsubtotales
SS,,
SS, - SS,
(13-30~)
SS,,
SS,
.-
(13-30b)
SSsubtotales
(13-31)
(ABC)
I1
cccc
,=1 / = I
h = l I=1
(75)2 + (102)2
(177)2
16
-~
45.5625
"
(82)2 + (95)2
I=
Y ....
abn
abcn
k=l
Y,..
c,=,cn
+ (92)2 "-(177)2
8
- 3.0625
16
Y....
- - - SS, -
abcn
SS,
45.5625 - 10.5625
(38)2 + (44)2
+ (47)2 + (48)2(777)2
4
- 10.5625
"
16
2
Y..k.
- (85)2
-
(177)2
C -
abcn
acn
j=
SS,,=
2
Y ....
-
1 Y.j..
SS,=
475
16
45.5625
3.0625
10.5625 - 3.0625
1.5625
-"
=
=
16
73.4573
5.0625
45.5625
-
45.5625
10.5625 - 3.0625
10.5625 - 3.0625
""
7.5625
.O625
1.5625
476
SsSubtotales
(AEC)
9
11
e@)
20 plg.lrnin
@
12
15
16
44
47
48
30 plg./rnin
@
6 x C totales
____
-~
___.
38
Y.ih.
A x
102
177
Y!.k.
C
.__
~"
.O25
.O40
30
"_
15
20
36
25
39
53
-~
82
y.
A / C totales
totales
Y,,..
B
_A_r
95
.
"
"
13-5
DISEA0 FACTORIAL 2K
477
Fuente d e
variaci6n
Tasa de alimentacidn (A)
Profundidad de corte (6)
Angulo de corte ( C )
AB
AC
BC
ABC
Error
Total
Suma de
cuadrados
45.5625
10.5625
3.0625
7.5625
0.0625
1.5625
5.0625
19.5000
92.9375
Grados de
libertad
1
1
1
1
1
1
1
8
15
Media
cuadratica
45.5625
18.69
4.336
10.5625
1.26
3.0625
3.10
7.5625
.O3 0.0625
.64 1.5625
2.08
5.0625
2.4375
Fo
Disefio 22
El tipo ms simple de diseAo 2 es el 22; esto es, dos factores A y B, cada uno en
dos niveles. Solemos considerarlos como los niveles bajo y alto del factor.
El disefio 22 se muestra enla figura 13.13. Advirtase que el disefio puede
presentarse geomttricamente como un cuadrado con las 2 = 4 ejecuciones
formando las esquinas de un cuadrado. Se emplea una notacin especial para
representar las combinaciones de tratamiento. En general una combinacin de
tratamiento se representa por medio de una serie de letras minsculas. Si esta
presente una letra, entonces el factor correspondiente se ejecutaen su nivel bajo.
Por ejemplo, la combinacin de tratamiento a indica que el factor A esta en el
nivel alto y el factor B est en el nivel bajo. La combinacin de tratamiento con
ambos factores en el nivel bajo se representa por medio de ( I ) . Esta notaci6n se
usa a lo largo de las series del disefio 2. Por ejemplo, la combinaci6n de
tratamiento en un z4 con A y C en el nivel alto y B y D en el nivel bajo se denota
mediante m .
Los efectos de inters en el disefio 2 son los efectos principales A y B y la
interaccin de dos factores AB. Sean las letras ( I ) , a, b y ab que representan
478
Alto
(+I
h+(l)
2n
2n
A=---
= -[u
2n
+ uh - h
(l)]
( 13-32)
De manera similar, el efecto principal deB se encuentra promediando las observaciones en la parte superior delcuadrado, donde B se encuentraen t~ nivel alto,
y sustrayendo el promedio de lasobservaciones en la base del cuadrado, donde B
est6 en elnivel bajo:
1
[h
2n
+ uh
(l)]
(1 3-33)
13-5
DISEA0 FACTORIAL 2K
479
ab
(1)
AB = _
___
+h
__
2n
2n
+ (I)
= [Uh
2n
( 13-34)
- u -
+ uh
( 1) .
En estas ecuaciones,los coeficientes del contraste son siempre + I o -1. Una tabla
de signos ms y menos, tal como la tabla 13.13, puede utilizarse para determinar
el signo en cada combinacin de tratamiento para un contraste particular. Las
cabezasde columna en la tabla 13.13 son los efectos principales A y B, la
interaccin AB, e I, que representa el total. Las cabezas de rengln son las
combinaciones de tratamiento. Ntese que los signos en la columna AB son el
producto de signos de las columnas A y B. Para generar un contraste a partir de
esta tabla,se multiplican los signos en la columna apropiada de la tabla 13.13 por
las combinaciones de tratamiento listadas en los renglones y se suman.
Para obtener las sumas de cuadrados para A, B y AB, podemos utilizar la
ecuacin 12-1 8, que expresa la relacin entre un contraste de un solo grado de
libertad y su suma de cuadrados:
(contraste)*
SS =
(coeficientes de contraste)*
( I 3-35)
SS,
+ ah
(l)]
4n
Efecto factorial
AB
480
SS, =
[b
+ ab - u - (I)]
4n
[ab
SS,,
+ (1) - u - b ] *
4n
+ ab - b - (1)l
-[59.299
59.156 - 55.686 - 56.0811
2(4)
1
b
ab - u - (I)]
2n
0.836
(11
a
b
ab
(pm)
Espesor
Factores de diseno
AB
+
-
Espesor (pm)
14.037,14.165,13.972,13.907
14.821,
14.757,
14.843,14.878
13,880,13.860,14.032,13.914
14.888,14.921,14.415,14.932
Total
Promedio
56.081
59.299
55.686
59.156
14.021
14.825
13.922
14.789
1
-[55.686
+ 59.156 - 59.299 - 56.0811 = -0.067
2(4)
1
A B = [ a b + (1) - a - b]
2n
1
= -[59.156
56.081 - 59.299 - 55.6861 = 0.032
2(4)
=
Las estimaciones numericas de los efectos indican que el efecto del tiempo de
depositaci6n es grandey que tieneuna direcci6n positiva (el aumento del tiempo
de depositaci6n incrementael espesor), puesto que cambiar
el tiempo de depositaci6n de bajo a alto cambia el espesor medio de la capa epitaxialen 3 3 6 pm.
Los efectos de la tasa de flujo de arsenic0 (B) y de la interacci6n A B aparecen
pequefos.
La magnitud de estos efectos puede confirmarsecon el analisis de varianza.
Las sumasde cuadrados paraA , B y A B se calculan empleandola ecuaci6n 13-35:
(Contraste)?
SS
SS,
[U
n-4
+ ab - b - (111
16
- [6.68812
=
SS,
16
2.7956
[ b + ab - u - (l)]
16
- [ - 0.53812
16
= 0.0181
[ab + (1) - a
SS,, =
16
[0.25612
=16
=
b]
0.0040
CAPiTULO 13
402
Fuente de
variaci6n
~~~
Suma de
cuadrados
1
1
AB
Error
Total
~~
Grados de
libertad
Media
cuadrdtica
134.50
2.7956
0.0181
0.0040
1
12
15
0.0040
0.0208
0.2495
3.0672
Fo
0.87
0.19
+ PlXl + E
y^
14.389 + ?)xl
bo
8,
14.389 +
(Y)(-l)
=
13.971pm
e2 =
e,
e,
13-5
DISEAO FACTORIAL 2K
483
Es fhcil verificar que los valores predichos y residuos restantes son, para tiempo
de depositacin bajo (x1 = -1) y tasa alta de flujo de arsdnico, p = 14.389 +
(.836/2) (-1) = 13.971 pm
e5 = 13.880 - 13.971 = -0.091
e6 =
e,
14.032 - 13.971
0.061
14.821 - 14.807
0.014
-0.050
14.843 - 14.807
0.036
0.071
e,
e,,
0.114
eI5 =
14.415 - 14.807
-0.392
eI6 =
14.932 - 14.807
0.125
CAP~TULO
1 3 DISEODE EXPERIMENTOSCON VARIOSFACTORES
484
Bajo
++ I O
-0.5 I
Tiempo de depositaci6n. A
-0.5
S ( A ' B ) = 0.051
.VA B ) = 0.110
Los mdtodos presentados en la secci6n previa para los disefios factoriales con
k = 2 factores cada unoen dos niveles pueden extenderse con facilidadm8s
a de
dos factores. Por ejemplo, considtrese k = 3 factores, cada uno en dos niveles.
Estees undisefo factorial 23, y tieneochocombinacionesdetratamiento.
Geomttricamente, el disefo es pn cubo como se muestraen la figura 13.18, con
las ocho ejecuciones formando
las esquinas del cubo. Este diseflo permite estimar
tres factores principales (A, B y C) junto con tres interacciones de dos factores
(AB, AC y BC) y una interaccibn de tres factores(ABC).
486
hc
+1-
-1
-1
+1
z3
Los principales efectos pueden estimarse con facilidad. Recurdese que las
letras minsculas ( I ) , a. h, ab, c, ac, bc y abc representan el total de todas las n
rkplicas en cada una de las ocho combinaciones de tratamiento en el diseiio. Con
respecto al cubo enla figura 13.18, estimaramoselefectoprincipal
de A
promediando las cuatro combinaciones de tratamiento en el lado derecho del
cubo, donde A esta en el nivel alto, y sustrayendo de esa cantidadel promedio de
las cuatro combinaciones de tratamiento en el lado izquierdo del cubo, donde A
est en el nivel bajo. Esto da como resultado
Demanerasimilarelefecto
de B es la diferenciapromediodelascuatro
combinaciones de tratamiento en la cara posterior del cubo y la cuatro en el
frente, o
B
1
"[b
4n
+ ab + bc + abc - a - c - uc
(l)]
(13-37)
C = "[c
4n
+ uc + bc + abc - U
b - a b - (l)]
(13-38)
1
AB(Cbaja) = " [ a b
2n
1
b] - "[a
2b
(l)]
-[abc - bc] 2n
"[ac
2n
- c]
(13-39)
AC
= "[M
(13-40)
BC
+ (1) + abc + a - b - c - ab - a c ] .
(13-41)
4n
1
"[bc
4n
El efecto de interaccidn
ABC es la diferencia promedio entre
la interacci6n AB en
los dos niveles deC. De tal modo
1
A B C = - { [ abc - bc] - [ U C - C ] - [ a b - b ] + [ a - (I)]}
4n
1
= "[abc - bc - ac
c - ab b + a - (l)]
(13-42)
4n
Las cantidades entre corchetes
en las ecuaciones13-36 y 13-42 son contrastes
en las ocho combinaciones de tratamiento. Estos contrastes pueden obtenerse a
partir de una tabla de signos mas y menos para eldisefio 23,mostrado en la tabla
Efecto
Combinaci6n
de tratamiento
(11
a
b
ab
C
ac
bc
abc
+
+
+
+
+
+
+
+
+
+
+
AB
+
+
-
+
+
+
-
+
+
CABC
BCAC
- +
- +
+ +
+
+
+
+
+
-
+
+
+-
+
-
488
Contraste
n2k-
(1 3-43)
(Contraste)2
n2k
(1 3-44)
+ ab + uc + U
-h-c
~ C
bc
- (l)]
489
Combinaciones
tratamientode
(1 1
a
b
ab
c
ac
bc
Rugosidad
superficial
-1
1
-1
1
-1
-1
-1
-1
-1
1
1
1
1
10,12
9,ll
12,15
11,lO
10,13
10.8
16,14
-1
1
1
-1
-1
1
1
-1
1
-1
1
abc
9,7
Totales
16
22
20
27
21
23
18
30
+ 27 + 23 + 30 - 20 - 21 - 18 - 161
-[22
4(2)
- [ 271 = 3.375
8
y la suma de cuadrados para A se determina empleando la ecuacin 13-44:
SSA =
(ContrasteA)2
n2k
AC
BC
ABC
0.125
-0.625
= 1.125.
Del examen de la magnitud de los efectos, es claro que la tasa de alimentacin
(factor A ) es dominante, seguidapor la profundidad de corte ( B ) y la interaccin
AB, aunque el efecto de interaccin es relativamente pequefio. El anlisis de
varianza se resume en la tabla 13.18, y confirma nuestra interpretacin de las
estimaciones del efecto.
Otros metodos para juzgar la significacihde los efectos El anlisisde
varianza es una manera formal para determinar cuiiles efectos son diferentes de
cero. Hay otros dos mtodos que son tiles. En el primer mtodo, podemos
calcular los errores estndar de los efectos y comparar la magnitud de los efectos
CAPiTULO 13 DISEO
EXPERIMENTOS
DE
490
Fuente de
variacidn
Suma de
cuadrados
A
B
C
AB
AC
BC
ABC
Error
46.5625
10.5625
3.0625
7.5625
0.0625
1.5625
5.0625
19.5000
Total
92.9375
Grados de
libertad
Media
cuadratica
46.5625
10.5625
3.0625
7.5625
0.0625
1.5625
5.0625
2.4375
Fo
18.69
4.33
1.26
3.1O
.O3
.64
2.08
15
con sus errores estndar. El segundo mtodo utiliza las grficas de probabilidad
para evaluar la importanciade los efectos.
El error estndar de un efecto se encuentra con facilidad. Si suponemos que
hay n rplicas en cada una de las 2k ejecuciones en el diseiio, y si y,,, y yI2,. . . ,
yiil son las observaciones en la ecuacin isima, entonces
'
/=1
i1
(1 3-45)
Contraste
n 2%'
491
n2ka2
(n2k-1)~
=-
n2k-2uL
(13-46)
s. e.(Efecto)
+S2
/------
1
(2.4375)
2 . 23-2
0.78
De modo que los lmites de la desviacin estndar en las estimaciones del efecto
son
A : 3.375 rfr 1.56
B: 1.625 f 1.56
C: 0.875 f 1.56
AB: 1.375 f 1.56
A C : 0.125 f 1.56
BC: -0.625
1.56
ABC: 1.125 f 1.56
stos son aproximadamenteintervalos de confianza del 95 por ciento.Ellos
indican que los dos efectos principales A y B son importantes, pero que los otros
efectos no lo son, dado que los intervalos para todos los efectos excepto A y B
incluyen el cero.
Las grficas deprobabilidad normal tambin pueden emplearse para juzgar la
significacin de los efectos. Ilustraremos ese mtodo en la seccin siguiente.
Proyeccih de los diseilos 2k Cualquier disefio 2k se disolver o proyectar en
otro disefio 2k con menos variables si uno o ms de los factores originales se
descarta. En ocasiones esto puede brindar evidencia adicional respectoa los
factores restantes. Por ejemplo, considrese el experimentode la rugosidad
superficial. Puesto que el factor C y todas sus interacciones son despreciables,
podramos eliminar el factor C del disefio. El resultado es disolver el cubo en la
figura 13.1S en un cuadrado en el plano A - B; sin embargo, cada una de las cuatro
492
-2.2500
-1.5833
-0.9167
-0.2500
0.4167
1.0833
1.7500
Residuos, e,
rugosidad superficial.
ejecuciones en el nuevo disefo tiene cuatro replicas.En general, si eliminamosh
factores de manera quer = k h factores permanezcan, el disefo 2k original con
n rplicas se proyectar en un disefo 2' con n2hrplicas.
Anlisis del residuo Podemos obtener los residuos de un disefo 2' utilizando
el mtodo demostrado antes para el disefo 2'. Como ejemplo, considkrese el
experimento de la rugosidad superficial. Los tres efectos ms grandes son A, B y
la interaccin AB. El modelo de regresin utilizado para obtener los valores
predichos es
B = P o + P I X , + P2x2 + Plzxlxz
donde x1 representa el factor A , x2 representa el factor B , y xlxz representa la
interaccin AB. Los coeficientes de regresidn PI,pzy Pl2se estiman a traves de
un medio de las estimaciones
del efecto correspondiente y Poes el gran promedio.
De tal modo
j= 11.0625 +
3.375
( 7 ] x I
1.625
1.375
( y ] x 2+ ( 1 / x , x 2
9.25
13-5
DISEO FACTORIAL 2K
493
Los valores observados en esta ejecucinson 9 y 7 , por lo que los residuos son
9 9.25 = -.25 y 7 - 9.25 = -2.25. Los residuos para las otras siete ejecuciones
se obtienen de manera similar.
En la figura 13.19 se muestra una grhfica de probabilidad normal. Puesto que
los residuos caen aproximadamente a lo largo de una lnea recta, no sospechamos
ninguna anormalidad de importancia en los datos. No hay indicaciones de aislamientos severos. TambiCn serade utilidad graficar los residuos contra los valores
predichos y contra cada uno de los factores A , B y C.
superior de esta columna ailadiendo las observaciones en pares adyacentes. Se calculan las entradas en la mitad inferior de esta columna cambiando el signode la primera entrada en cada parde las observaciones
originales y sumando los pares adyacentes.
2. Se marca la columna adyacente (2). Se construye la columna (2) empleando las entradas enla columna ( I ) . Se sigue el mismo procedimiento
empleado para generar la columna ( I ) . Se contina este proceso hasta
construir k columnas. La columna (k) contiene los contrastes designados
en los renglones.
3. Se calculan las sumas de cuadrados para los efectos elevando al cuadrado
las entradas en la columna k y dividiendo entre n2k.
4. Se calculan las estimaciones del efecto dividiendo las entradas en la
columna k entre r ~ 2 ~ .
Ejemplo 13.8 Considrese el experimento dela rugosidad superficial enel
ejemplo 13.7. ste es u n diseAo 2 con n = 2 rplicas. El anlisis de estos datos
empleando el algoritmo de Yates se ilustra en la tabla 13.19. Ntese que las sumas
de cuadrados calculadas a partir del algoritmode Yates concuerdan con los
resultados obtenidos previamente en el ejemplo 13.7.
uadrados
494
Suma de
Combinaciones
tratamiento
de Respuesta
(1
16
22
20
27
21
23
ab
C
ac 7
bc
abc
18
12
30
(1) (2)
38 85
47 92
4 4 13
efectos
(3) Efecto
177 Total
27
A
B
13
48
14
11
4
1
10
7
1
-5
9
AB
C
AC
BC
ABC
Estimaciones
de
(3)*/r12~
(3>/r12~
-
45.5625
10.5625
7.5625
3.0625
,0625
1.5625
5.0625
3.375
1.625
1.375
0.875
0.125
-- 0.625
1.1 25
13-5
DISEO FACTORIAL 2K
495
Factor de diseno
_____
Entrehierro
Presidn
Nivel
Bajo (
Alto (
)
)
(cm)
(mTorr)
0.80
450
550
1.20
..
"
Potencia
Flujo de C2Fs
C
(SCCM)
D
(w)
125
275
200
325
La tabla 13.20 presenta los datos a partir de las I6 ejecuciones del diseilo 24.
La tabla 13.2 I es la de los signos ms y menos para dicho diseilo. Los signos en
las columnas de esta tabla pueden emplearse para estimar los efectos del factor.
A modo ilustrativo, la estimacin del factor A es
A
-[ u
8
+ uh +
-c
1
= -
[669
Cl -
hc
~d - hcd]
hd
604
633
101.625
= -
101.625
1.625
AB
C=
306.125
AD
= -
153.625
7.875
BD
= -
0.625
7.375
ABD
4.125
= -
2.125
5.625
AC
24.875
CD
BC
43.875
ACD
ARC'
= -
15.625
BCD
ABCD
25.375
40.125
496
A
(Entrehierro)
B
(Presi6n)
C
(Flujo de c2h)
D
(Potencia)
Tasa de grabado
(A / mtn)
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
550
669
604
650
633
642
601
635
1037
749
1052
868
1075
860
1063
729
-1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
nes del efecto. Si ninguno de los efectos es significativo, entonces las estimaciones se comportartin como unamuestraaleatoriaextradadeuna
distribucih
normal con media cero, y los efectos graficados se encontraran aproximadamente
a lo largo de una lnea recta. Aquellos efectos que no caen sobre la linea son
factores significativos.
TABLA 13.21 Constantes de contraste para el diseto Z4
A
(
1 )
a +
b a b +
c
a c t
b c a b c
AB
C
- - + - +
- - - -
+
+
+
-
+ +
+ + + + +
a d + -
b d - +
a b d + +
C d - a c d i bed - +
+
+
+
- + - +
+
+
+ +
- +
+ +
+
+
-
+
-
_ "
BD AB0
" + +
AD
+ - + - +
+
+
AC
BC
ABC
+
+
+
+ - +
-
abed++++++++++
CD ACD
+
+
+ +
+
+
-
+
+
-
+
-
+
+
+
+
+
+
+
-
BCD ABCL
-
+
+
~
+
-
+
+
+
~
+
~
+
+
-
+
+
+
-
13-5
DISERO FACTORIAL2K
-153.6250
497
-77.0000 -0.3700
79,2500
152.375G
229.8000
306.1230
Efectos
Figura 13.20 Grdficas de probabilidad normal de los efectos del experimento de
grabado con plasma.
Fuente de
variacibn
A
B
C
D
AB
AC
AD
BC
BD
CD
Error
Total
Suma de
cuadrados
Grados de
libertad
41,310.563
10.563
21
7.563
374,850.063
248.063
2,475.063
94,402.563
7,700.063
1.563
18.063
10,186.815
531,420.938
1
1
1
1
1
1
1
1
1
1
5
15
Media
cuadrdtica
41,310.563
20.28
10.563
217.563
374,850.063
183.99
248.063
1.21
2,475.063
99,402.563
48.79
3.78
7,700.063
1.563
18.063
2,037.363
Fo
< 1
< 1
<1
< 1
< 1
498
1400
120c
.
e
E
1000
800
600
400
m
al
I-
Y Dbaio
= 275
200
Bajo (0.80cm)
Alto (1.20cm)
A(Entrehierro1
9 = 776.0625 -
101.625
y ) x
+(
306.125
153.625
7 ) x 4- y ) x 1 x 4
Por ejemplo, cuando tantoA como D esthn en el nivel bajo el valor predicho es
9 = 776.0625
=
306.125
+ [ --)(-l)
2
___
- ( E )2( - 1 ) ( - 1 )
597
e2 = 604 - 597
e3 = 638 - 597 = 41
e4 =
601 - 597
.
.
.
.
.
.
1
+1
z/ O
-1
-2
-72.5000
0.
499
66.5000
-49.3333
-3.0000
43.3333
Residuos, el.
+ a - 6 - (1)
ContrasteB= ab + 6 - a - (1)
Contraste,
= a6
500
Bloque 1
[ T I
Bloque 2
p-1
N6tese que estos contrastesno son afectados por los bloques puesto que en cada
contraste hay una combinaci6n de tratamiento mas y una menos de cada bloque.
Esto es, cualquier diferencia entre el bloque I y el bloque 2 se cancelaldn. El
contraste para la interacci6n AB es
Contraste,,
ab
+ (1)
-a-
Bloque 2
abc
501
nicos valores posibles deL (mod 2) son O y 1, esto asignar las combinaciones
de tratamiento 2k a exactamente dos bloques.
Como un ejemplo considkrese un disefio 2 con ABC confundido con bloques.
Aqu xl corresponde a A, x2 a B, x3 a C y
= cq = a3= 1. De tal modo, el
contraste definido paraABC es
(Y,
= x*
+ x2 + x 3
Para asignar las combinaciones de tratamiento alos dos bloques, sustituimos las
combinaciones de tratamiento enlos contrastes definidos comosigue:
+ l(0) = O = O (mod 2)
+ l(0) = 1 = 1 (mod 2)
l(1) + l(0) = 1 = 1 (mod 2)
l(1) + l(0) = 2 = O (mod 2)
c : L = l(0) + l(0) + l(1) = 1 = 1 (mod 2)
ac: L = l(1) + l(0) + l(1) = 2 = O (mod 2)
bc: L = l(0) + l(1) + l(1) = 2 = O (mod 2)
abc: L = l(1) + l(1) + l(1) = 3 = 1 (mod 2)
l(0) +
a : L = l(1) +
6 : L = l(0) +
ab: L = l(1) +
(1): L
l(0)
l(0)
abc = bc
= ab2c = ac
= abc2 = ab
=b
=
ab= a
=
abc
502
Combinacidn
tratamiento
de
Respuesta
(1)
a
b
ab
C
ac
bc
abc
d
ad
bd
abd
cd
acd
bcd
abcd
Efecto
(1) (4)
(3)
(2)
3
7
5
7
6
6
8
6
4
10
4
12
8
9
7
9
Efecto
cuadrados
estimado
111
10 22
48
12 26
21
63
5
12 30
4
14 33
-1
17
1 4 76
4
16 - 2
1 -19
-4
17 14
-3
-1
16
3
3
4
2
4 1 5
2
2
3 1 3
O
2 - 3- 8
-2
1
.-11
7
6 -2
O
-1
8 - 2 - 3- 3
1
2
2
1
0 - 3
-1
-1
Total
A
B
AB
C
AC
BC
ABC
D
AD
BD
ABD
CD
ACD
BCD
ABCD
27.5625
1.5625
,0625
3.0625
22.5625
.5625
.O625
14.0625
10.5625
,5625
3.0625
,0625
,5625
,5625
.O625
2.625
0.625
- 0.125
0.875
- 2.375
- 0.375
- 0.1 25
1.375
1.625
- 0.375
0.875
- 0.125
- 0.375
- 0.375
- 0.125
= x*
+ x2 + x3 + xq
Bloque 2
ac = 6
bc = 8
a d = 10
bd = 4
cd= 8
abcd = 9
abc = 6
bcd = 7
acd = 9
abd = 12
503
Blocks (ABCD)
A
B
Error (ABC +
D
AB
AC
AD
BC
BD
CD
ABD ACD
Total
+ BCD)
Suma de Grados de
cuadrados
libertad
Media
cuadratica
.O625
27.5625
1.5625
3.0625
14.0625
.O625
22.5625
10.5625
,5625
.5625
,0625
4.2500
84.9375
.O6
,0625
27.5625 25.94
1.47
1.5625
2.88
3.0625
14.0625 13.24
.O6
,0625
22.5625 21.24
9.94
10.5625
.53
,5625
.53
,5625
.O6
,0625
1.0625
1
1
1
1
1
1
1
1
1
1
1
4
Fo
15
+ xj
L2 = x3
+ x4
L,
abcd
Bloque 2
Bloque 3
L 1 = 1 , LL, =
, =O0 , L L2 ,==11 , L 2 = 1
abd
bcd
acd
Bloque 4
ad
cd
504
Combinacidn
de tratamiento
Efecto factorial
~
+
+
abc
~~
C AC AB
-
~-
i-
BC
ABC
t
t
505
Una fraccin media del diseiio 2" contiene 2" - ejecuciones y suele llamarse
diseo factorial fraccionario2"". Como ejemplo, considrese el diseo 23-';esto
es, una fraccinmedia del diseo P . La tabla designos m8s y menos para el diseo
2' se muestra en la tabla 13-25. Supngase que seleccionamos cuatro combinaciones de tratamientos a, b, c y abc como nuestra media fraccin. Estas combinaciones de tratamientos se muestran en la mitad superior de la tabla
13-25.
Usaremos tanto la notacin convencional (a, b, c, . . .) y la notacin de ms y
menospara las combinaciones detratamiento.Laequivalenciaentrelasdos
notaciones es como sigue:
Notacin 1
Notacin 2
a
b
c
abc
+"
-++
"
+++
AB('
:[ U
I[ -N
C' =
:[ - u
+~hc.]
+ h c + U/K]
- h + c' + C l h C ~ ]
h
c'
-.
AC
I[ - U
AB
[ -U
[ U -
+ uhc.1
+ h + cth(.]
h + c. + U ~ C ]
h
--
<'
506
puesto que A . I
A y A'
A'BC
BC'
B . ABC,'
AB''
AC'
Y
C=C.ABC=ABC'=AR
Supngase ahora que hubiramos elegido l a otra fraccin media; esto es, las
combinaciones de tratamientoen la tabla 13.25 asociadas con menos en ABC. La
relacin de definicih para este diseo es 1 = -ABC. Los seudnimos son A =
-BC, B = -AC, y C = -AB. As que las estimaciones de A, B y C con esta fraccin,
en realidad estiman A - BC, B - AC y C -AB. En la prctica, suele no importar
cul fraccin media seleccionamos. La fraccin con el signo ms en la relacin
de definicin suele llamarse lafraccin principal, y la otra fraccin con frecuencia se denomina fraccin alternativa.
Algunas veces utilizamossecuencias de diseos factoriales fraccionarios para
estimar efectos. Por ejemplo, supngase que hemos ejecutadola fraccin principal del diseo 23". De este diseo tenemos las siguientes estimaciones de efecto:
t.,= A
C,
/(
<'
+ A'
+ AB
Supngase que estamos dispuestos aasumir en este punto que las interaccionesde dos factores son despreciables. Si lo son, entonces el diseo 23 - ' ha
producido estimaciones de los tres efectos principales, A , B y C . Sin embargo, si
507
r!;= A
BC
r!i=B-AC
r!i=C -
AC
de ;(e,
Efecto, i
+ e,')
de f if, - L',')
i =S A
( A + B C + A - B C ) =$ A
[A+BC-(A-BC)]=BC'
i =: B
( B + A C + B - A C ) =$ B[ B + A C - ( B - A C ) ] = A C
i=C
$ ( C + A B + C - A B ) =k C[ C + A B - ( C - A B ) ] = A B
',
2' completo
A
2'
A
I,
AH(
C = AB
508
decidimos utilizarun diseo 24" con I = ABCD para investigarlos cuatro factores
entrehierro ( A ) , presin ( B ) ,tasa de flujo de C,F, (C) y el ajuste de potencia(D).
Este diseose construir escribiendoun 2' en los factores A, B y C y fijando luego
D = ABC. El diseo y las tasas de grabado resultantes se muestran en la tabla
13.26.
En este diseo, los efectos principales se hacen seudnimos con las interacciones de tres factores; ntese que
el seudnimo de A es
A.I=A-ARCD
A
A
A'BC'D
RC'D
y de modo similar
B
c'
=
=
L) =
AC'D
ABD
AB<'
Las interacciones de dos factores son seudnimos con cada una de las otras. Por
ejemplo, el seudnimo deA B es CD:
=
=
BD
BC.
TABLA 13.26
z4"
ABC
Fuente de
variaci6n
(11
c
+
+
+
~
ad
bd
ab
cd
ac
bc
abcd
~~
Tasa de
grabado
"
.
550
749
1052
650
1075
642
601
729
DEL
FRACCIONAL
13-7 REPLICA
DISEO2
509
-127.00
eH = B + ACD = 4.00
e, = c + ABD = 11.50
Y
e,
+ ABC = 290.51
Es claro quePA y PB son grandes, ysi creemos que las interacciones de tres factores
son despreciables, entonces los efectos principales A(entrehierr0) y D(ajuste de
potencia) afectan de manera significativa la tasa de grabado.
Las interacciones seestiman formando las columnasAB, AC y AD y agreghndolas a la tabla. Los signos en la columna AB son +, -, -, +, + -, -, +, y esta
columna produce la estimacin
,e,
=
=
AB CD
-10.00
601
+ 729)
ek, = A C + BD =
,e, = A D + BC =
-25.50
-197.50
510
z3
Por ejemplo,la figura 13.25 presentaun diseo 23. Adviertase que estedisefio
se proyectarii en un factorial completo en cualesquiera dos de los tres factores
originales. En consecuencia, si pensamos que alo mhs dos de los tres factores son
importantes, el disefio 23-1 es excelente
para identificar los factores significativos.
Algunasvecesllamamos experimentos de eliminacin a los quesirvenpara
identificar a relativamente pocos factores significativos de un gran nmero de
factores. Esta propiedad de proyeccih es sumamente til en la eliminaci6n de
factores ya que permite eliminar factores
despreciables, lo que resulta en un
experimento miis consistente en los factores activos que quedan.
749, 7291
! 1052, 1075)
+
D (Potencia)
-1
(650, 642)
(550, 6011
+1
.4
Entrehierro
13-7
FRACCIONAL
RCPLICA
DEL DISEA0 2
511
13-7.2
512
ABCE
ACDF
BDEF
BCE = C D F = ABDEF
= A C E = DEF = ABCDF
C
= ABE=ADF
= BCDEF
D
= A C F = BEF = A B C D E
E
=ABCB
= DF
=ACDEF
F = A C D = BDE = ABCEF
AB = CE = BCDF=ADEF
A C = BE = DF
= ABCDEF
A D = CF = B C D E= A B E F
A E = BC = C D E F = A B D F
A F = C D = BCEF = A B D E
B D = EF = A C D E = A B C F
BF = D E = A B C D = A C E F
ABF = CEF = BCD = A D E
CDE = ABD = AEF = CBF
=
DEL
FRACCIONAL
13-7 REPLICA
513
2k
ABCE
BCDF = A C D G
N6tese que cualquier efecto principal en este diseflo sera seud6nimo con tres
factores e interacciones mhs altas y que las interacciones de dos factores seritn
seud6nimos entre s . De tal modo Bste es un disefio de resoluci6n IV.
Para siete factores, podemos reducir an miis el nmero de ejecuciones. El
disefio
es unexperimentodeochoejecucionesqueacomodasiete
variables.
TABLA 13.27 Construccidn del disefio 26
e I = ACDF
+
+
+
+
+
+
+
+
E = ABC
F = ACD
(1)
aef
be
abf
cef
ac
bcf
abce
df
ade
bdef
abd
cde
acdf
bed
abcdef
514
+
+
+
+
+
+
+
+
=
=
ABD
BEG
ACE
= AFG =
BCF
DEF
=
=
ABCG
ADEG
=
=
BCDE
CEFG
=
=
Este disefio es deresolucin 111, puesto que el efecto principal sehace seudnimo
con interacciones de dos factores. Si suponemos que la totalidad de las interaccionesdetres y ms factores son despreciables, los seudnimosdelossiete
efectos principales son
e, = A BD + CE + FG
~,=B+AD+CF+FG
~,.=C+AE+BF+DG
t,=D+AB+CG+EF
e E , = ~ + A c + ~ G + ~ F
t,=F+BC+AG+DE
t,=G+CD+BE+AF
13-8 RESUMEN
515
13-8
Resumen
516
13-9 Ejercicios
su libro de 1984 (Design and Analysis ofExperiments, 2a. edicicin, John Wiley
& Sons) D. C. Montgomery presenta los resultados deun experimento que involucra
un acumulador utilizado en el mecanismo de lanzamiento de un misil tierra-aire
disparado desde elhombro. Pueden emplearse trestipos de materiales para elaborar
las placas de la batera. El objetivo es disefar una batera que relativamente no es
la batera es el voltaje
afectada por la temperaturaambiente. La respuesta de salida de
mhimo. Se eligen tres niveles de temperatura y se ejecutaun expermento factorial
con cuatro replicas. Los datos se muestran a continuacicin. Que material de placa
recomendara usted?
13-1 En
Temperatura (OF)
Medio
Material
Bajo
130
74
155
180
150
159
188
126
138
168
110
160
34
80
136
106
174
150
70
40
75
58
122
115
45
20
82
25
58
70
120 104 96
139
60
82
20 30
74
6485
50 92
92 66
86 45
68 85
25
73
61
44
98
73
88
78
13-3 Suponga que en el ejercicio 13-2 los tipos de pintura fueron efectos fijos. Calcule
13-9 EJERCICIOS
517
Maquina
Operador
1o9
110
110
115
108
1o9
110
116
114 111
111
112
110
111
1o9
112
111 1o9114
111
112
115
1o9
112
B
C
Pruebe la interaccibn y los efectos principales en el nivel del 5 por ciento. Estime
las componentes de la
varianza.
13-5 Suponga que en el ejercicio 13-4 los operadores se eligieron al azar, pero que s610
Su supervisora
desea determinar silos esthdares fijadospor ellos son afectadospor alguna interaccibn entre los ingenieros
y los operadores.La supervisora selecciona tres operadoras
al azar y efecta un experimento en el que los ingenieros fijan los tiempos para un
mismo trabajo. Ella obtiene los datos que se muestran aqu. Analice los datos y
extraiga conclusiones.
Operador
Ingeniero
2.
2.59
2.78
2.38
2.49
2.40
2.72
2.1 5
2.862.87
2.85
2.72
2.66
13-7 Un artculo en Industrial Quality Control (1956, pp. 5-8) describe un experimento
para investigar el efecto de dos factores (tipo de vidrio y tipo de fbsforo) en la
brillantez de un tubo de televisibn. La variable de respuesta medida es la corriente
necesaria (en microamperes) para obtener un nivel de brillantez especificado.Los
datos se muestran a continuacih. Analice los datosy extraiga conclusiones, suponiendo que ambos factores sonfijos.
518
Tipo de fsforo
Tipo de vidrio
280
290
285
300
31 O
295
290
285
290
230
235
240
260
240
235
220
225
230
13-9 Se esthn investigando los efectos sobre la resistencia de papel del porcentaje de
concentracih de madera dura en la pulpacruda, la limpieza,y el tiempo de cddigo
de lapulpa. Analice los datos que se
muestran en la siguientetabla, suponiendo que
los tres factores sonfijos.
Tiemoo de cocido de 1.5 horas Tiemoo de cocido de 2.0 horas
Porcentaje
Limpieza
Limpieza
de
concentracin
500
400
650
500
400
650
madera
durade
96.6
15
97.5
96.0
97.7
96.0
99.4
99.8
98.4
98.6
99.6
100.4
100.6
100.9
98.5
97.2
96.0
96.9
98.4
97.6
97.5
98.1
98.7
98.0
99.6
99.0
96.6
95.6
96.2
97.4
98.1
97.6
98.4
97.0
97.8
98.5
99.8
10
20
a
b
ab
C
ac
bc
abc
Replica
I
II
22 1
325
354
552
440
406
605
392
31 1
435
348
472
453
377
500
41 9
13-9 EJERCICIOS
529
Replica
Combinaci6n
d e tratamiento
II
190
174
181
183
177
181
188
173
(1)
a
b
ab
C
ac
bc
abc
RBplica
Combinaci6n
de tratamiento
193
178
185
180
178
180
182
170
d
ad
bd
abd
cd
acd
bcd
abcd
I1
198
172
187
185
199
179
187
180
195
176
183
186
190
175
184
180
d = 1000
e=
800
de = 1900
900
ad
1100
ae =
1200
ude
1500
h = 3400
hd
3000
he
3500
hde
4000
ah = 5500
ahd
6100
ahe = 6200
uhde = 6500
520
600
cde =
1500
1100
ace = 1200
ucde =
2000
hcd =
3300
hce =
3006
hcde =
3400
abcd =
6000
ahce =
5500
ahcde =
6300
c=
600
cd =
800
ac =
IO00
acd =
hc = 3000
5300
ahc
ce =
(1)
42
a =
31
h = 45
ah =
29
30
bd = 50
abd = 25
c=
39
cd = 40
ac =
28
acd =
25
46
ahc = 32
bed =
abcd =
50
23
hc =
a)
6)
c)
a=@
ad =
Estime los efectosy prepare una grfica dcprobabilidad normal de los mismos.
Construyauna grhfcadeprobabilidadnormal
de los residuos y comente
respecto a los resultados.
Construya una tabla de analisis de varianza suponiendo que son despreciables
las interacciones de tresy cuatro factores.
13-17 Considere los datos de la primera rplica del ejercicio13-10. Suponga que no todas
estas observaciones podran ejecutarse en las mismas condiciones. Establezca un
disefio para ejecutar estas observaciones en dos bloques de cuatro observaciones,
cada una con ABC confundido. Analice los datos.
13-18 Considere los datos de la primera rplica del ejercicio13-12. Construya un disefio
con dos bloques de ocho observaciones cada uno, conABCD confundido. Analice
los datos.
13-19 Repita el ejercicio
13- 18 suponiendo que
se requieren cuatro bloques. Confunda ABD
y ABC (y en consecuenciaCD) con bloques.
13-20 Construya un disefio 25 en cuatro bloques. Seleccione los efectos que se van a
confundir de manera que se confundan las
interacciones mAs altas posibles con
bloques.
13-9 EJERCICIOS
521
RBplica 1
Bloque 1
(1)
ab
ac
bc
Bloque 1
Bloque 2
Bloque 2
= 99
= 52
= 42
= 95
b = 51
c = 108
abc = 35
bc =
67
abc = 36
a)
13-22 R. D.
uce = 1.22
hce = -2.09
ubc = 1.93
u = 6.79
ude = 6.41
hde = 3.45
abd = 5.68
cde = 5.22
urd =
hcd
uhcde
4.38
4.30
= 4.05
=
a)
522
+
+
+
+
+
3
-
+
-
+
+
-
+
+
~
+
t
+
+
+
+
+
+
-
+
+
+
+
+
+
+
-
- 7.81,
7.12 7.25,
7.44 7.88,
+
+
+ 7.75,
+ 7.44,
+ 7.69,
+
+ 7.59 + 7.50,
7.78, 7.81
8.15,
7.50, 7.50
7.59, 7.75
7.54,
7.69,
7.56,
7.56,
7.50,
7.88,
7.50,
7.63,
7.32,
7.56,
7.18,
7.81,
7.78,
8.18,
7.56,
7.56,
8.00,
8.09,
7.52,
7.56,
7.1 8,
7.88
7.88
8.06
7.44
7.69
7.50
7.56
7.44
7.62
7.25
a)
Cul es el generador para esta fraccin? Escriba en forma completa la estructura del seudnimo.
b ) Analice los datos. Qu factores afectan la altura libre media?
c) Calcule el intervalo de la altura libre para cada ejecucin. Hay alguna indicacin de quealguno de estos factoresafecta la variabilidad de la altura libre?
d) Analice los residuos de este experimento y comente sus resultados.
13-24 Un artculo en Industrial and Engineering Chemistry (More on Planning Experiment to Increase Research
Efficiency, 1970, pp. 60-65) utiliza un disefio 2-* para
investigar el efecto deA = temperatura de condensacin, B = cantidad del material
1, y C = volumen del solvente, D = tiempo de condensacin y E = cantidad del
material 2, en el rendimiento. Los resultados obtenidos son como sigue:
23.2
ud =
ah = 15.5
hc =
c =
U)
b)
c)
16.9
16.2
cd
23.8
nce = 23.4
hde = 16.8
ohcde = 18.1
523
13-9 EJERCICIOS
d) Prepare una tabla de anlisis de varianza. Verifique que estn disponibles las
e)
13-26 Considere el diseiio 26 en la tabla 13-27. Suponga que despus delaniilisis de los
datos originales, encontramos quelos factores D y F pueden eliminarse. Qu tipo
de diseiio 2kse dejaen las variables restantes?Compare los resultados con el ejercicio
13-25. Puede usted explicar por quC las respuestas son diferentes?
13-27Suponga que en el ejercicio 13-12 slo fue posible ejecutar una fraccin mediadel
diseio 24. Construya el diseAo y realice el anlisis estadstico, empleando los datos
de la replica1.
13-28Suponga que en el ejercicio 13-15 slo podra ejecutarse una fraccin
diseiio 2. Construya el diseiio y efecte el anlisis.
media del
Captulo 14
Regresin lineal simple y
correlacin
526
+ PlX
(14-1)
+ PlX + L
Po
(14-2)
donde E es un error aleatorio con media cero y varianza o.Los {E) se supone
tambikn que son variables aleatorias no correlacionadas. El modelo de regresi6n
de la ecuacibn, 14-2 que involucra s610 una variable regresiva x a menudo recibe
el nombre de modelo deregresi6n lineal simple.
Sup6ngase que tenemos n pares de observaciones, por ejemplo ( y , , x,), (y,,
x,), . . . , ( yn, xn). Estos datos pueden emplearse para estimar los parametros
desconocidos PoyPIen laecuaci6n 14-2. Nuestro procedimiento de optimizacibn
sera el metodo de mfnimos cuadrados. Esto es, estimaremos Poy PIde manera
que la suma de cuadrados de las desviaciones entre las observaciones y la lnea
de regresibn sean mnimas. Empleando luego ecuaci6n
la
14-2, podemos escribir
y,=~,,+plx,+~,
i = 1 , 2 ,... , n
(14-3)
L=
r=l
6;
c ( Y , - Po
Pl.,)
(14-4)
i=l
Los estimadoresdemnimoscuadradosde
satisfacer
Po y PI,digamos
bo Y b,, deben
( 14-5)
527
n
i-1
(14-6)
C YiXr i=l
6, =
iYr)(i
r=l
X 1 )
i=l
(
CXPI1
(14-8)
i x j 2
I= 1
i=l
donde = (I/n)Z y= gi y X = (l/n)Z y= ,xi. Por tanto, las ecuaciones 14-7 y 14-8
son los estimadores por minimos cuadrados de
ordenada
la
al origen y la pendiente, respectivamente. El modelo de regresi6nlineal simple ajustado es
9 = bo+ B 1 X
(14-9)
II
S,,
I1
(x;
r=l
-q
1 = l
F l X l 1
x,' -
2 =
I1
(14-10)
528
Ejemplo 14.1 Un ingeniero qumico est investigando el efecto de la temperatura de operacin de proceso en
el rendimiento del producto.El estudio da como
resultado los siguientes datos:
Temperatura, C ( x )
6 60
E
5
50
e
100
110 120
130 140
150 160
170
190
180
Temperatura, x
529
10
10
1450
xi =
C y , = 673
f==l
j = 67.3
X = 145
i=l
10
10
x,? = 218,500
10
y,'
= 47,225
xiyi = 101,570
i=l
[C
10
S,,
1-1
x; -
xi)
10
r=l
(1450)2
= 218,500
10
= 8250
\-
Y
10
S,."
( E.;)(
1-1
XlY1
(1450)(673)
i?- 1Y i )
= 101,570
10
i- 1
10
= 3985
p1
A
S
,,
3985
SXF
8250
.48303
= A = - -
&, = j
- fi,? = 67.3 -
(.48303)145 = -2.73939
= -2.73939
+ .48303~
Puesto que s610 hemos supuesto tentativamente queel modelo de linea recta
es apropiado, deseamos investigar la suficiencia del mocelo. Las propiedades
estadfsticas de los estimadores
de mfnimos tuaeados &, y PIson tiles en evaluar
la suficiencia del modelo.Los estimadores p0 y son variables aleatorias, puesto
que son justamente combinaciones lineales
de las yi,y tstas son variables aleatorias. Investigaremos las propiedadFs de no neutralidad y a! varianza de estos
estimadores. Considtrese primeroPI.El valor esperado de PI es
530
= P1
puesto que Z :(= l(x, -3 = O, C :'= Ix,(xi- 3 = S,.. y por la suposicihde que
= O. De tal modo, bi es estimador insesgado de la pendiente verdadera
PI.
Considerese ahora la varianza dePI.Puesto que hemos supuesto que V(E,) = CT *,
se concluye que V( y,) = o', y
-v [
y;(x; -
i=l
.-)I
(14-13)
Las variables aleatorias { y,} no estdn correlacionadas debido a que (E,) no esta
correlacionada. Por tanto, la varianza de
la suma en lae c u a c i h 14- 13 es justo
la suma de
las
varianzas,
y
la
varianza
de
cada termino en la suma, digamos
v[ yi(xl - x )], es o '(xi -X )'. En consecuencia,
1
v( Bl) = " U 2
sxx
"
(x,
-q
i=l
(14-14)
AI usar un planteamiento similar, podemos mostrar que
A b,
"6'?/Srr.
Ndtese
SIMPLE
14.1 REGRES16N LINEAL
531
SS,
1 e;
i=l
n
c (Y
-Pi),
(14-16)
i=l
(14-18)
es un estimador insesgado deQ '.
El analisis de regresi6nutiliza
se ampliamente, y con frecuenciase abusa. Hay
varios abusos comunesde la regresi6n que deben mencionarse brevemente. Debe
tenerse cuidado al seleccionar las variables con las cuales seconstruyen los
modelos de regresi6ny al determinar la forma de la funci6n de aproximaci6n. Es
muy posible desarrollar relaciones estadsticas entre variables queno tienen
ninguna relaci6n en un sentidoprhctico. Por ejemplo, podra intentarse relacionar
la resistencia al corte de la soldadura de puntos conel nmero de cajasde papel
de computadora utilizado porel departamento de procesamiento de datos. Puede
incluso aparecer unalnea recta para proporcionar un buen ajuste paralos datos,
pero la relacibn es irrazonable como para confiar enplla. Una fuerte asociaci6n
observada entre variables no necesariamente implica que existe una
relaci6n
causal entre esasvariables. Los experimentos disefiados son la nicamanera para
determinar relaciones causales.
Las relaciones deregresi6nson validas s610 paravaloresde la variable
independiente dentro del intervalo de los datos originales. La relaci6n lineal que
532
donde hemos supuesto una alternativa de dos lados. Ahora bien, puesto que
las son NID(0, 02),se desprende directamente que las observaciones yi son
NID(Po + P,xi, o).De la ecuacin 14-8 observamos que PIes una combinacin
lineal de las observaciones y,. De tal manera, PI es una combinacip lineal de
variablesaleatorias normales independientes y, en consecuencia, O
, , S: N @ , ,
oz/Sxx),empleando las propiedades de no neutralidad y varianza de PI de la
seccin 14.1. Ademhs, PIes independiente de M&. Entonces, como resultado de
la suposicin de normalidad, la estadstica
14-2
PRUEBA DE HIP6TESIS
EN
LA REGRESldN LINEAL
SIMPLE
81 - P l . 0
533
{m
( 14-20)
(14-21)
sigue la distribuci6n t con n - 2 grados de libertad bajo Ho: j?, = PI,o. Rechazasi
ramos Ho: j?, =
101
a/2, ~ 7 - 2
Ho: P o = P 0 , o
HI: Po f
(14-22)
Po.0
usaramos la estadistica
to =
-/
Bo
- Po.0
(14-23)
Ho: p1 = o
H , : p1# O
(14-24)
yI
yI
I
r
(a)
534
'I
1
X
fb)
(al
i=l
1=1
1=1
SS,
+ SS,
(14-26)
Al comparar la ecuacin 14-26 con la ecuacin 14- 17, notamos que la suma de
regresi6n de cuadrados SSR es
SS, =
a&
(14-27)
535
Suma de
cuadrados
SS,
SS,
S,,
=
=
Grados de
libertad
Media
cuadretica
MS,
MSE
B1sXy
S,
n-2
n- 1
&Sx,
F,
MSR / MS,
(14-28)
,,
I1
S,,,
.. = C Y , ' i=l
iq= l
(673)2
47,225 - - = 1932.10
10
536
Fuente de
variacidn
Suma de
cuadrados
Grados de
libertad
1924.87
Regresidn
Error
Total
1 2138.74
8
9
7.23
1932.1O
Media
cuadratica
Fo
1924.87
.90
p^,S,,
(.48303)(3985)1924.87
1932.10 - 1924.87
= 1.23
- a) por ciento en la
14-3
ESTlMACldN
DE
537
ordenada al origen es
(14-32)
.48303 - 2.306
{E
- I PI I
.48303
+ 2.306
sta se simplifica en
.45894 I
PI IS0712
PI
538
EO
Lmites de
canfianza
100
110
120
130
140
150
160
170
45.56 50.39 55.22 60.05 64.88 69.72 74.55 79.38
f1.30f1.10
+.93 k.79k.71
180
190
84.21
89.04
del 95%
El ancho del intervalo deconfianza para E( y(x,) es una funcin de xo. El ancho
del intervalo es un mnimo para
x. = X y se ensancha conforme(xo-Y[aumenta.
1O0
o)
.E
50
"
40
1O
0
100
110
120
130
Temperatura,
140 150 160
x
170
180
190
14-4
539
140) 5 64.88
+ .71
64.17 2 E ( y ( x o = 140)
I
65.49
4 = Yo - $0
se distribuye normalmentecon media cero y varianza
I n
1
=u21+-+
(xo-
S,,
x)2
540
2.306 .90 1 +
\,j
;o
(1608250
- 145)2
que se simplifica en
72.21
I y(,
76.89
541
Anhlisis residual
la figura 14.5 representa la situacin normal, en tanto que los patrones (b),
( c ) y (6)representan anomalas. Si los residuos aparecen como en (b), entonces
la varianza delas observaciones puede incrementarse con el tiempo o con la
magnitud de las y, o x,. Si una grfica de los residuos contra el tiempo tiene la
apariencia de ( b ) ,entonces la varianza de las observaciones se incrementa con el
542
tiempo. Las grhficas contra j i y x, que se observan como (e) indican tambitn
desigualdad de varianza. Las grhficas de residuos que se observan como (4
indican la insuficiencia del modelo; esto es, tkrminos de mayor orden que deben
ser afiadidos al modelo.
e6 = 70.00 - 69.72
e2 = 51.00 - 50.39
e3 = 54.00 - 55.22
= -1.22
.61
e4 = 61.00
- 60.05
.95
e5 = 66.00
- 64.88
1.12
.28
- 89.04
.79
- .O4
543
2oL
80
70
60
30
50
40
30
70
k-
20
10
t95
98
I
-1 5
Figura 14.6
-1.0
O
.5
Residuos
1.0
1.5
2.0
-2.0
544
2.00 1.00
e;
.o0
-1.00
-2.00
-- -
-__ --__ -
40
2.00
Y CORRELAC16N
50
60
?I
EO
70
90
I
xi
G,,
S45
La prueba implica dividir la suma de cuadrados del error o del residuo de los
siguientes dos componentes:
SS,
ssp, f
SS,,,
..
. 1
Y2n2
observaciones repetidasen XI
observaciones repetidasen x2
observaciones repetidas en X m
(14-38)
i-1 u = = l
- -
(14-40)
y la rechazaramos siFo > F , ,,-2, -m.
Este procedimiento de prueba puede introducirse con facilidad en el analisis
de varianza conducido para la significacibn de la regresibn. Si se rechaza la
hipbtesis nula dela suficiencia del modelo, este debe abandonarse
y debe inten-
__.
.-
111_
CAPiTULO 14 REGRES16N
LINEAL
546
SIMPLE Y CORRELACldN
5.0
2.0
3.2
2.2
2.6
3.7
1.8
2.8
2.3
5.6 6.9
6.5
6.0
6.0
5.6
5.6
3.2
3.4
2.1
2.8
3.5
y 3.4
5.0
1 .o
3.3
4.0
5.6
6.0
1.8050
.lo66
.9800
.o200
Totales
%Y, -
PI2
Grados
libertad
de
.1250
3.0366
o.
Al ajustar un modelo de
regresi6n a los datos experimentales, una buena
prctica es utilizar el modelo de grado
m& bajo que describa de
manera adecuada
los datos. La prueba de la falta
de ajuste puede ser til respecto a esto. Sin
TABLA
14.4
Fuente de
variacibn
.4952
Regresi6n
15
Residual
(Falta de ajuste)
(Error puro)
Total 16
Suma de
cuadrados
3.541
7.429
4.3924
3.0366
10.970
Grados de
libertad
1
7.15
8 1.27
7
Media
cuadratica
3.541
,5491
.4338
Fo
14-6.
TRANSFORMACIONES
A
UNA LINEA RECTA
547
548
CAPiTULO 14 REGRESI6NSIMPLE
LINEAL
Y CORRELACldN
In Po + & x
+ In c
Po f
PlZ
Po + & X + e
14-7 Correlacin
Nuestro desarrollo delanzlisis de regresin hasta ahora hasupuesto que x es una
variable matemitica, medida con error despreciable, y que y es una variable
14-7 CORRELAC16N
549
012
0102
donde o12
es la covarianza entre y y x.
La distribuci6n condicional de
y para un valor dado de x es (vdase el captulo
8)
donde
01
Po = EL1 - P2P-
(14-44a)
02
PI =
01
(14-446)
02
Y
=
a:(l -
p2)
(14-44~)
550
CAPiTULO 14 REGRES16N
LINEAL
SIMPLE Y CORRELAC16N
po = r - p,.IX
-
(14-46~)
It
(14-466)
I=
( 14-47)
Ntese que
( 14-48)
14-7 CORRELAC16N
551
b1
b1
Ho:p=O
H,:p#O
(14-49)
r&?i
to=
4l -7r -
(14-50)
la cual sigue
la distribuci6n t con n - 2 grados delibertad si H,: p = O es verdadera.
En consecuencia, rechazariamos la hip6tesis nula
si (rol. td2, - *. Esta prueba
equivale a la prueba de la hip6tesis
H,: PI = O dada en la secci6n 14-2. Esta
equivalencia sigue directamente de laecuaci6n 14-48.
El procedimiento de prueba para
la hip6tesis
Ho: P = Po
4 : P =?t
Po
(14-51)
552
arctanh r
l + r
l - r
- In -
(14-52)
l + p
l - p
- In -
y varianza
(Fl - 3)-l
p = popodemos calcular la estadstica
Por tanto, para probar la hip6tesisHo:
u; =
Z,
(14-53)
I
tanh arctanh r
+ ____
4 3
(14-54)
- e")/(e" + e"').
Ejemplo 14.7 Montgomery y Peck (1982) describe una aplicaci6n del andlisis
de regresi6nen la cualuna ingeniero que trabajacon botellas de refresco investiga
la distribuci6n del productoy las operaciones del servicio de ruta para
mhquinas
vendedoras.Ellasospechaque
el tiemporequerido para cargar y serviruna
mdquina se relaciona con el nmero de latas entregadas del producto. Se selecciona una muestra aleatoria de 25 expendios al menudeo que tienen mquinas
vendedoras y se observa para cada expendio el tiempo de solicitud-entrega (en
minutos) y el volumen del producto entregado (en latas). Los datos se muestran
en la tabla 14.5. Suponemos que el tiempo de entregay el volumen del producto
entregado siguen una distribuci6nnormal conjunta.
Al emplear los datos en la tabla14.5, podemos calcular
,Sv;,
6105.9447
S,,
698.5600
El modelo de regresin
j
5.1145 + 2.9027~
Sxy= 2027.7132
24.45
35.00
25.02
16.86
14.38
60
24.35
7.08
553
14-7 CORREIACldN
Obsewaci6n
1
2
3
4
5
6
7
8
9
56.63
10
11
12
13
Tiempo
Nmero
de
Tiempo
de
latas, x
Obsewaci6n
entrega, y
14
15
16
2
4
4
17
2
8
11
10
8
4
2
2
9
8
4
11
12
9.95
31.75
18
19
20
23
27.50
24
37.00
41.95
21
22
11.66
21.65
17.89
69.00
10.30
34.93
46.59
44.88
16
54.1 2
25
22.1 3
21.15
S,.
,. ,
[ S,y,S,,]'/'
20
1
10
15
15
17
6
5
x y y se calcula a partir de
2027.7132
9,
r=
Nmero
de
de
entrega, y
latas, X
[(698.5600)(6105.9447)] 'I2
la
.9818
H,:
H,:pfO
- .9818m
dl -
r
=
24.80
~~
Puestoque
23 = 2.069, rechazamos Ho y concluimos que el coeficientede
correlaci6n p # O. Por ltimo, podemos construir un intervalo de confianza del
95 por ciento en p a partir de la ecuacin 14-54. Puesto que arctanh r = arctanh
.9818 = 2.3452, la ecuaci6n 14-54 se vuelve
1"'m
2.3452 -
I p I tanh 2.3452
que se reduce a
9 5 8 5 I p I .9921
+-
CAPTULO 14 REGRESldNSIMPLE
LINEAL
554
Y CORRELACI6N
14-8 Resumen
Este captulo ha presentado el modelo deregresin lineal simple y mostr cmo
pueden obtenerse las estimaciones de mnimos cuadrados de los parmetros del
modelo. Se desarrollaron tambin los procedimientos de la prueba de hipdtesisy
las estimaciones de los intervalos de confianzalosdeparametros del modelo. Las
pruebas de hiptesisy los intervalos de confianzarequieren la suposicin de que
lasobservaciones y sonvariablesaleatoriasdistribuidasnormal
eindependientemente. Se presentaron los procedimientos para probar la suficiencia del
modelo, incluso una prueba de falta de ajuste
y de anlisis del residuo. Tambin
se present el modelo de correlacin para tratar el caso en el que x y y se
distribuyen en formanormal y conjunta. Se analiz la equivalencia del problema
de la estimaci6n de parmetros del modelo de regresin para el caso en el que x
y y son normales conjuntas en el caso donde x es una variable matemtica. Se
desarrollaron los procedimientos paraobtener estimaciones puntuales y de intervalo del coeficiente de correlaci6n
y para la prueba de hip6tesis en tomo al
coeficiente de correlacin.
14-9 Ejercicios
14-1 Montgomery y Peck (1982) presentan datos relativos al rendimiento de 26 equipos
de la Liga Nacional de Ftbol de los Estados Unidos en 1976. Se sospecha que el
nmero de juegos ganados ( y ) se relaciona con el nmero de yardas ganadas por
corrida por el oponente(x). Los datos semuestran a continuaci6n
Equipos
Juegos
ganados
Washington
Minnesota
New England
Oakland
Pittsburgh
Baltimore
Los Angeles
Dallas
Atlanta
Buffalo
Chicago
Cincinnati
Cleveland
Denver
Detroit
Greenbay
Houston
(y)
10
11
11
13
10
11
10
11
4
2
7
10
9
9
6
5
5
Yardas
corridas
por
los oponentes (x)
2205
2096
1847
1903
4757
1848
1564
1821
2577
2476
1984
1917
1761
1709
1901
2288
2072
14-9
555
EJERCICIOS
Kansas City
Miami
New Orleans
New York Giants
New York Jets
Philadelphia
st. Louis
San Diego
San Francisco
Seattle
Tampa Bay
a)
b)
c)
d)
e)
6
4
3
3
4
10
6
8
2
O
2861
241 1
2289
2203
2592
2053
1979
2048
1786
2876
2560
Ajuste un modelo de regresidn lineal que relacione los juegos ganados con las
yardas ganadas por un oponente.
Pruebe la significacih de la regresi6n.
Encuentre un intervalo de confianza en la pendiente.
Que porcentaje de la variabilidad total se explica mediante este modelo?
Encuentre los residuos y prepare griificas residuales apropiadas.
14-2 Suponga que nos gustara utilizar el modelo desarrollado en el ejercicio 14-1 para
sus oponentes
predecir el nmero de juegos que un equipo ganara si puede alimitar
a 1800 yardas por carrera. Encuentre una estimaci6n puntual del nmero de juegos
un intervalo
ganados si los oponentes ganan
s610 1800 yardas por carrera. Encuentre
de prediccidn del95 por ciento en el nmero de juegos ganados.
14-3 La revista Motor Trend presenta con frecuencia datos de rendimiento paraautomb
1975 de
viles. La tabla siguiente presenta datos del volumen
de Motor Trendrelativos
y el cilindraje del motor para
15 autombviles
al rendimiento de gasolina por milla
Automdvil
Millas/Gal6n, y
Apollo
Omega
Nova
Monarch
18.90
17.00
20.00
18.25
20.07
11.20
22.12
21.47
30.40
16.50
14.39
16.59
19.73
13.90
16.50
Duster
Jensen Conv.
Skyhawk
Monza
Corolla SR-5
Camaro
Eldorado
Trans Am
Charger SE
Cougar
Corvette
Desplazamiento
(pulgada
cbicas),
350
351
225
440
231
96.9
31 8
351
350
CAPiTULO 14 REGRESION
LINEAL
556
SIMPLE Y CORRELAC16N
a)
en seguida:
Precio
de
8.1
ventall O00
25.9
29.5
27.9
25.9
29.9
29.9
30.9
28.9
35.9
31.5
31 .O
30.9
30.0
36.9
41.9
40.5
43.9
37.5
37.9
44.5
37.9
38.9
36.9
45.8
14-9
557
EJERCICIOS
Ajuste un modelo de regresin que relacione los precios de venta con el pago
de impuestos.
b ) Pruebe la significancia de la regresin.
c ) Que porcentaje de la variabilidad en el precio de venta se explica a partir de
los impuestos pagados?
d) Encuentre los residuos para este modelo. Construya una grfica deprobabilidad
normal para los residuos. Grafique los residuos contrai y contra x. El modelo
parece satisfactorio?
a)
14-7 La resistenciadelpapelutilizadoen
146.9
y
x
101.4
117.4
117.1
106.2
1.o
1.5
1.5
1.5
2.0
y
x
11 1.3
123.0
125.1
145.2
134.3
2.5
2.8
2.8
3.0
2.5
2.0
146.8
131.9
133.9
2.4
2.2
a)
14-8 Calcule los residuos para el modelo de regresin en el ejercicio 14-7. Prepare grficas
Consumo/lOOO
Temp.Mes
Ene.
Feb.
Mar.
Abr.
Mayo
Junio
u)
h)
c)
21
24
32
47
50
59
185.79
4.47 21
288.03
424.84
454.58
539.03
Mes
Julio
Aug .
675.06
Sept.
Oct.
Nov.
Dic.
Temp.
Consumoll000
68
74
62
621.55
50
41
30
/3,
562.03
452.93
369.95
273.98
558
S)
e)
14-10 Calcule los residuos parael modelode regresi6nen el ejercicio14-9. Prepare grhficas
92.58
1.01
95.61 89.86
1.43
1.02
85.20 99.42
96.85 96.73
95.00
87.31 93.65 96.07 98.66
Pureza (%)
1.15
1.40 1.55
1.55 1.55
1.46
Hidrocarburo ($4,)
1.O1
.99
.95
a)
b)
Estadistica
86
75
69
75
OR
80
81
75
81
Estadstica
84
71
62
90
65
7293 85
OR
a)
83
80
86
81
1
1
71
76
65
72
14-9
EJERCICIOS
c)
559
95 por cientodel
Sujeto
1
2
3
4
5
6
7
8
9
10
11
12
13
Peso
165
167
180
155
212
175
190
21 o
200
149
158
169
170
Peso
PS Sujeto
sist6lica
14
15
16
17
18
19
20
21
22
23
24
25
26
130
133
150
128
151
146
150
140
148
125
133
135
150
PS sist6lica
172
159
168
174
183
21 5
195
180
143
240
235
192
187
153
128
132
149
158
150
163
156
124
170
165
160
159
6)
Po +
plx
6.
Muestre que
= /j,, t
[il
.x,
i c
pero la respuesta es afectada por una segunda variable x2 tal que la verdadera funcin
de regresin es
I:( y )
/I,,
p , XI
t /I2-\-,
560
la pendiente PI tan pequefia como sea posible. Dnde deben tomarse las observals implicaciones xi, i = I , 2, . . . , n, de manera que se minimice V(&)? Analicea
ciones practicas de estalocalizacin de lasx,.
donde las w iSOR constantes desconocidas, llamadas a menudo pesos. Muestre que
a
lsecuaciones normales demnimos cuadrados resultantes son
11
I1
I1
b,,cw,+81cW,x,=
I- 1
r=l
r=1
r=I
,I
II
&E
CW,?:
?!x, + 81
I==
YX,X
,=I
14-19 Considere los datos que se muestran a continuacibn. Su ponga quela relacin entre
(W
14-20 Considere los datos de peso y presin sangunea en el ejercicio 14-14. Ajuste un
modelo de nointerseccin a los datos y comparelo con el modelo que se obtuvo en
el ejercicio 14-14. Cuhl modelo es superior?
14-21 Los datos que semuestran a continuacin, adaptados de Montgomeryy Peck (1982),
presentan el nmero de deficientes mentales certificados por cada
10,000 de la
poblaci6n estimada en el Reino Unido( y ) y el nmero de licencias de receptores de
radio emitidas (x) por la BBC (en millones) para los ailos 1924 a 1937. Ajuste un
modelo de regresin que relacione y con x. Comente acerca delmodelo. Especficamente, la existencia deuna fuerte correlacinimplica una relacinde causa-efecto?
AAo
1924
1925
1926
1927
8
8
9
10
1.350
1.960
2.270
2.483
14-9 EJERCICIOS
561
_"
"
"
Ano
1928
1929
1930
1931
1932
1933
1934
1935
1936
1937
"
"
Captulo 15
Regresin mltiple
= Bo
+ PIXI + P2x2 + E
(15-1)
564
y = Po
(15-3)
(1 5-4)
que es un modelo de regresi6n lineal multiple con tres variables regresoras. Los
modelos queincluyen efectos deinteraccin tambih pueden analizarse por medio
de mtodos de regresibn lineal mltiple. Por ejemplo, supngase que el modelo
es
Si dejamos x3 = xlxz y /I3 = /3,2, entonces la ecuaci6n 15-5 puede escribirse como
y = Po + PlX, + P2x2 + P3x3 +
(15-6)
15-2
ESTlMAClbN DE
PARAMETROS
TABLA 15.1
565
...
x2
Y1
x11
x12
Y2
x21
x22
yn
Xnl
Xn2
k
'
...
...
'lk
'2k
...
xnk
que es un modelo de regresin lineal. En general, cualquier modelo de regresin que es lineal en los purmetros (los valores P ) es un modelo de regresin
lineal, sin importar la forma de la superficie que genera.
(15-7)
L=
CEf
r=l
\*
(15-8)
CAP~TULO
15 REGRES16N MULTIPLE
566
Y
=
B(,, B,.. . . . B,
-2
y , - )do -
i=
p,x,,
/=1
Xlj
=0
1 , 2 , , . . ,k
(15-9b)
bo, b l > .. . , h
Es mssimpleresolverlasecuaciones
normales si ellas se expresanen
notacin de matriz. Daremos ahora un desarrollo matricial de las ecuaciones
normales que es afn al desarrollo de la ecuacin 15-10. El modelo en ttrminos
de las observaciones,ecuacin 15-7, puede escribirse ennotacin matricial como
y=xp+&
donde
567
Ef
= E'& = (y
- X$)'(y - xp)
i=l
y'y - 28'X'y
+ $'XXS
+ $'XXfl
(15-11)
51 = - 2 x y + 2X'XB = o
b
que sesimplifica a
xxf3= X'y
(15-12)
Las ecuaciones 15-12 son las ecuaciones normales de mnimos cuadrados. Ellas
son idnticas a las ecuaciones
15-10. Para resolver las ecuaciones normales,
multiplquense ambos lados de la ecuacidn 15-12 por la inversa de X'X. De tal
modo, el estimador de mnimos cuadrados de /3 es
p = (XX)"Xy
(15-13)
568
I1
C xrl
i=l
...
xi2
I,
xi1
i=l
X;
i= 1
r=l
i=l
. .
XikXiZ
XikXil
xrk
I1
i=l
xp
(15-14)
9; = Bo+
Is;xi,
i = 1 , 2 , ..., n
j-1
e=y-9
+ PIXI + A x 2
569
X=
9.9
24.4
31.7
5 .O(
25 .O:
16.8(
14.31
9.6(
24.31
27.3
17.0t
37 .O(
41.9:
11.6f
21.65
17.89
69.00
10.30
34.92
16.59
14.88
54.12
56.63
!2.13
!1.15
Y=
La matriz X'X es
1
=I
25
206
8,294
y el vector X'y es
..
"
P
.
.
X
"
"-
...
206
2,396
77,177
2
1108
50
400
8,294
77,177
3,531,848
570
TABLA 15.2
Nmero de
observacidn
Nmero de latas
Distancias (pies)
X1
x2
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
2
8
11
10
8
4
2
2
9
8
4
11
12
2
4
50
110
120
550
295
200
375
52
1 O0
300
412
400
500
360
205
400
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
7.50
7.00
1.95
1.66
1.65
7.89
9.00
0.30
4.93
17.08
600
250
46.59
44.88
2
590
21
54.1
6.63
2.13
22
23
24
25
20
1
10
15
15
16
17
6
5
51
21.15
585
540
290
O
1 O0
400
o
206
725.821
8,294][
206
2,396
77,177
8,008.37
8,294
77,177
3,531,848
274,811.31
.214653
-
,007491
,007491
.O01671
- .O00340
2.26379143
.O1252781
- .O00340
- .O00019
.O00019
.O000015
725.82
8,008.37
274,811.31
571
Nmero de
observacidn
37
54.1
22.1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Y,
El
9.95
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
27.50
17.08
8.38
25.60
33.95
36.60
27.91
15.75
12.45
8.40
28.21
27.98
18.40
37.46
41.46
12.26
15.81
18.25
64.67
12.34
36.47
46.56
47.06
52.56
56.31
19.98
21 .o0
.o0
2
3
el ejemplo 15.1
el = YI - E,
1.57
1.15
- 2.20
- 1.60
- 2.89
1.11
1.93
1.20
- 3.86
- .48
- 1.32
- .46
.49
- .60
5.84
- .36
4.33
- 2.04
- 1.54
.O3
-2.18
1.56
.32
2.15
.15
-
E[(X'X)"X'y]
E [ ( X X ) - 'Xr(xp +
E)]
572
E [ (XX)XXp
+ (XX)Xe]
=S
E(
[ B - E(B)][S - E(fi,l)
La matriz de covarianza de es
una matriz simtrica ( p X p ) cuyo elemento
jjsimo es lavarianza de y cuyo elemento(i,j)simo es la covarianza entre b,
y
La matriz de covarianza de es
6.
CO(
/3) = 0*(XJXj- - l
n
r=l
Al sustituir e = y
-y
SS,
ee
- Xb, tenemos
=
(y - XS)(y
XS)
+ pxrxp
= yfy - 2CjXy + pfxfxp
yly - p x y - ytxp
573
yy = C y ,
27,177.9510
1=1
Y
B X y = t2.26379143 2.74426964
=
.O12527811
8,;zq
274,811.31
27,062.7775
SS,
= yy - p x y
=
27,177.9510 - 27,062.7775
115.1735
La estimacibn de o 2es
&2=
SS,
- 115.1735 = 5.2352
n - p
25-3
B, - P,
4%
j = O,l,
..., k
(15-19)
574
Ejemplo 15.3 Construiremos un intervalo de confianza del 95 por ciento respecto al parhmetro PI en el ejemplo 15. l . Ntese que la estimacin puntual de PI
es PI = 2.74427, y que el elemento de la diagonal de (XX) correspondiente a
es CI1= .001671. La estimacin de cr * se obtuvo en el ejemplo 15.2 como
5.2352, y
22 = 2.074. En consecuencia, elintervalodeconfianza
en PI se
calcula a partir dela ecuacidn 15-20 como
2.74427 - (2.074)/(5.2352)(.001671)
I& I
2.74427
+ (2.074)1/(5.2352)(.001671)
que se reduce a
2.55029 I
I
2.93825
x$
(15-21)
Este estimador insesgado, puesto queE( -$o) = E(x& = xdp = E( yo),y la varianza
deF0 es
v(joj= a 2 ~ ~ ( ~ t ~ ) - 1 ~ ,
Por tanto, un intervalo de confianza del lOO(1
respuesta media en el punto xol,xo2, . . . , xOkes
A
l
- t a / 2 , n - p /Fx=
I
E (yo) 5
(15-22)
j o + ta,2. ,,~p
a la
-/
(15-23)
15-4
DE PREDlCCldN
575
NUEVAS OBSERVACIONES
2.26379
[ 1 8 27512.74427
27.66 minutos
.O01671
- .O00019
- .O000015
.O00340
.O1253
G*x(~(XX)X(~= 5.2352Al
- .O07491
- .O00340
.214653
2751
- .O00019
.O07491
][ ]
275
27.66 - 2 . 0 7 4 J m
I
y,, S
27.66
I y,) I
28.66
+2.074Jm
que se reduce a
26.66
15-4
=XIS
(1 5-24)
576
yo
5 .go
+ x~(x'x)-'xo)
+ iu/2,
p (
+ x~(X'X)"x,)
(15-25)
'k
Intervalo original
para XI
-4
15-5
PRUEBA
DE
HIP6TESIS EN LA REGRES16N
LINEAL
MULTIPLE
577
- 2.074/5.2352(1
+.OM)
I yo I
27.66
+ 2.074/5.2352(1 + . O W )
I
yo I
32.51
xl, x*, . .
- x-,
'x
578
Fuente de
variaci6n
Regresi6n
Error o residuo
Total
Suma de
cuadrados
SS,
SSE
Grados de
libertad
Media
cuadrhtica
MSR
MSE
n-k-1
n- 1
S,,
Fo
MSR/ M s E
Fo =
SSR/k
MSR
=SS,/(" - k - 1) MS,
(15-27)
-,
" 1
Por tanto, la suma de cuadrados de laregresi6n es
(15-28)
(15-29)
579
(15-30)
27,177.9510 -
6105.9447
27,062.7775 -
5990.7712
(725.82)2
25
(725.82)2
25
Y
SS, =
syy- SS,
yy - pyy
115.1735
MS,
2995.3856
F--o - MS,
5.2352
572.17
Puesto queFo > F.,,,,,,, = 3.44, el tiempo de entregase relaciona con el volumen
de entrega o con la distancia, o con ambos. Sin embargo, notamos que esto no
necesariamente implica que larelacidn encontrada es apropiada para predecir el
tiempo de entrega como una funcin del volumen y la distancia. Se requieren
pruebas adicionales de la suficiencia del modelo.
580
Grados de
libertad
Fuente de
variacidn
Suma de
cuadrados
Observaci6n
2
5990.771 2995.3856
2
115.1735
22
24
61 05.9447
Error
Total
15-5.2
Media
cuadrhtica
Fo
572.17
5.2352
H,: pJ = O
HI:
3
/, O
(15-31)
Si H,:pi = O no se rechaza, entonces esto indica quexi puede ser eliminada del
modelo. La estadstica de prueba para esta hiptesis es
(15-32)
donde Cjj es el elementode la diagonal de (X'X)" correspondientea h. La
hip6tesis nula H,,: P, = O se rechaza si I f o / > fd2, - - ,. Ntese que esto es en
realidad una prueba parcial o marginal, debido a que el coeficiente de regresibn
depende de todas las demas variables regresoras x,(i f. j ) que estan en el
modelo. Para ilustrar el
empleo de esta prueba, considrese los datos en elejemplo
15.1, y supngase que deseamos probar
H,: p2= O
H I : p2 # O
581
,/-
t,=--"--
.O1253
bz es Cz2=
4.4767
/(5.2352)(.0000015)
y=x$+E
H,:
=O
H,:
p1 # O
(15-33)
X$ + E = XISl 4 X*& + E
(15-34)
p)
B'Xy
( p gradosde libertad)
CAPITULO
SS2
15 R E G R E S I ~ N
MLTIPLE
Y
MS,
yIy - p x y
=
n-p
X,P, +
(15-35)
SS,(
p,)
&X;y
( p - r grados
de
libertad)
(15-36)
583
podemos medir el efecto de conjuntos devariables. En la secci6n 15-11 mostraremos cmola prueba parcial F desempea un papel principal en la construccidn
del modelo; esto es, en la bsqueda del mejor conjunto de prueba de variables
regresoras que se usarn en el modelo.
P2# O
Para probar esta hip6tesis, necesitamos la suma de cuadrados extra debida ap2,
o bien
SSR(P,IP,, Po) = SS,(P,,
P2,
= SS,(P,?
P21Po) - S ~ R ( P l I P 0 )
SSR(P19
PAPO) = BXY -
y en el ejemplo
calculada
SS,(
(24
n
grados
libertad)
de
= 5990.7712
(2
pl~po)= p,sXy
= 5885.8521
Po + plxl +
E,
tenemos
(1 gradodelibertad)
(1 gradode
libertad)
Advirtase que la MS, del modelo completo, empleando tanto x, como x2, se
utiliza en el denominador de la estadstica de prueba. Puesto que
22 = 4.30,
rechazamos H,:P2= O y concluimos que la distancia(x2)contribuye de manera
significativa al modelo.
584
(15-39)
5990.7712
6105.9447
de
.981137
585
99
98
95
o
o
20
30
o
o
o
5 0 L
a
7n
95
98
99
o
o
-I
*
"15
-2
I
-6
-.4
-2
586
-5 -
20
30
10
40
Grficaresidualcontra
Figura 15.4
:E
4
50
60
i.
figura 15.3
70
587
SS,
SS,,
+ SS,
La suma de cuadrados del error puro SS, se calcula a partir de las respuestas
obtenidas por observaciones repetidas en el mismonivel de x.
Este procedimiento general puede, en principio, extenderse a la regresin
,, requiere observaciones repetidas en y en el mismo
mltiple. El clculo de SS
conjunto de niveles de las
variables regresoras x,, xl, . . . ,xk. Esto es, algunos de
los renglones de la matriz X deben ser iguales. Sin embargo, la ocurrencia de
observaciones repetidas es relativamente improbable en la regresin mltiple, y
el procedimiento descrito en la seccin 14-5.2 a menudo no es til.
Daniel y Wood (1 989) han indicado un mtodo para medir el error puro en el
caso en el queno hay puntos de repeticin exactos. El procedimiento busca puntos
en el espaciox que son vecinos cercanos, es decir, conjuntosde observaciones
que se han tomado con niveles casi idnticos dex,, x2, . . . , xk. Las respuestas y,
de tales vecinos cercanos
pueden considerarse comopuntos repetidos y emplearse
para obtener una estimacin del errorpuro. Como una medida de la distancia entre
xalquiera de los dos puntos x,,, x12,. . . , Xjk y x,,,, x,,2, . . , ,
Daniel y Wood
xoponen la suma ponderada de la distancia al cuadrado
( 15-40)
MODELO
589
Desviaci6n esthnnero
acumulativa
dar
1
.3278E + 00
+ O1
259E
2
3
.2218E + O1
4
.1677E + O1
5
.1512E t O1
3
.1633E + O1
7
.1680E + O1
1
.1662E + O1
1
.1544E + O1
)
.1939E + O1
.1881E + O1
.2253E + O1
.2245E + O1
.2117E + O1
.2136E + O1
.2084E t O1
.2026E + O1
.1960E + O1
.1907E + O1
.1862E + O1
.1847E + O1
.1802E + O1
.1943E + O1
.1987E + O1
.2048E t O1
.2031E + O1
.2027E + O1
.2073E + O1
.2045E + O1
.1999E + O1
.1944E + O1
.1926E + O1
.1921E + O1
.1951E t O1
.1937E + o1
.1949E + O1
.1952E + O1
.1976E + O1
.1971E i O1
.1968E + O1
.1199E
1
- 02
.7495E - 03
.7495E - 03
.2998E - 02
.4317E - 02
.6745E - 02
.4797E - O1
.1026E + O1
.1082E + O1
.1140E + O1
.1199E t O1
.1285E + O1
.1347E + O1
.1439E + O1
.1442E + O1
.1443E + O1
.1630E t O1
.1738E + O1
.2026E + O1
.2113E + O1
.2350E + O1
.2578E + O1
.2578E t O1
.2638E + O1
.2761E + O1
.2844E + O1
.2881E + O1
.2890E + O1
.2956E + O1
.3128E + O1
.3167E t O1
.3465E + O1
.4137E + O1
.5757E + O1
.5766E t O1
.5768E + O1
.5773E + O1
.5795E + O1
.5802E + O1
.5829E + O1
Observaci6n
Observaci6n
delta
Residuo
8
6
5
19
16
14
20
2
2
15
6
15
6
16
2
11
22
12
19
4
3
5
15
10
18
8
1
21
14
8
1
20
24
24
9
3
7
7
19
4
15
10
4
11
7
21
5
10
16
16
11
11
25
9
25
23
13
12
12
12
9
25
9
7
14
14
22
18
7
7
22
25
2
3
13
16
11
13
13
,3700
4.7300
2.4100
,0600
.9600
2.5300
2.2100
1,7400
.6700
6.2000
1.4700
7.1600
2.4300
5 1O0
2.7100
1.4700
1.2400
,9500
1,0800
1.1400
1.7400
,9700
5.6900
3.3800
3.9700
1.8000
2.1 700
3.7400
1.4400
,7300
,3600
1.5300
2.0000
3.3000
1.6600
2.6900
2.2900
3.2500
2.0300
2.0900
.os paresdepuntosquetienen
590
e,,,
pueden emplearsepara obtener una estimacin del error puro. La estimacin
se obtiene a partir del intervalode los residuos en los puntos i e ,'i digamos
= le,
- e,.\
.886E
vi,
591
m,
P,, + P I X +
( I 5-41 )
1.48
1.40
40
50
65
Ajustaremos el modelo
y =
70
75
80
90
592
+ .00012507x2
2
o
1.60
1.50
1.40
1.30
1.20
''lol,
, , , , ,
1.M)
30 20
Figura 15.6
40
50
60
70
Tamafio del lote, X
80
;
90
593
Fuente de
variaci6n
Suma de
cuadrados
Regresidn
Error
5254
.o01 1
.5265
Total
11
Grados de
libertad
2
9
Media
cuadrhtica
21
.262700
.o001
Fo
21 71 .O7
Ho: Pll
4 :
+0
PI1
60)
= ssR(81,
Plll&)
- ssR(PllPO)
ssR(PlIP0)
= -4942
Pl) = s s R ( P I ,
= S254
PllIPO)
- ssR(PIIfiO)
- .4942
= .O312
594
Fuente d e
variacibn
Regresi6n
Lineal
Cuadrdtica
Error
Total
Suma d e
cuadrados
S%(&
Grados de
libertad
PlllBO) = 5254
SSR(/3,1&) = .4942
SSR(/31,1&, ,871 = .O312
.O011
,5265
2
1
1
9
11
Media
cuadrdtica
.262700
4084.30
.494200
,031
258.1
200
.o00121
FO
21 71 .O7
x2
5 s
Tipo de herramienta
Acabado
superficial
Yi
302
302 42.03
50.1 O
48.75
47.92
47.79
52.26
50.52
45.58
44.78
33.50
31.23
37.52
37.1 3
34.70
33.92
32.13
35.47
33.49
32.29
RPM
de corte
225
200
250
245
235
237
265
259
221
21 8
224
21 2
248
260
243
238
224
251
232
21 6
302
302
302
302
302
302
302
302
41 6
41 6
41 6
41 6
416
41 6
41 6
416
41 6
41 6
4 16
o,
CAP~TULO1 5 REGRESI~NMLTIPLE
596
que es un modelo de lnea recta con pendiente PIe interseccin Po.Sin embargo,
si xz = 1, entonces el modelo se vuelve
Y
Po + P A + @,O)+
= Po
+ P* + P I X 1
quees un modelodelnearecta
con pendiente PI e interseccin
+ h. En
consecuencia, el modelo y = Po + Pix, + Ax2 + E implicaque el acabado
superficial se relaciona linealmente con la velocidad y que la pendiente PI no
dependedeltipodeherramientadecorteutilizada.
Sin embargo, el tipode
herramienta de corte afecta
la interseccin,y /Iz indica el cambio en la interseccin
asociado con un cambio en el tipo de herramienta de la 302 a la 416.
La matriz X y el vector y para este problema son como sigue:
x=
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
225
200
250
245
235
237
265
259
221
218
224
212
248
260
243
238
224
251
1 232
1 216
O
O
O
O
O
O
O
O
1
1
1
1
1
1
1
1
1
1
'Y
45.44
42.03
50.10
48.75
47.92
47.79
52.26
50.52
45 S 8
44.78
33 S O
31.23
37.52
37.13
34.70
33.92
32.13
35.47
33.49
32.29
El modelo ajustado es
597
Suma de
cuadrados
Fuente de
variacin
Regresin
Media
cuadratica
Grados de
libertad
506.0297
1O1
2 2.0595
SSFi(B,lBOs,)
sS~i(&lB,So1
9
Error 17
Total
(130.6091)
(881.4504)
.7.7943
1O19.8538
FO
11 03.69'
(11
284.87a
130.6091
881.4504
922.52a
1
(1 1
19
1 , 2 , . .. , n
(15-43)
como
(15-44)
o, puesto que 3
/;= 7,
(15-45)
donde
I1
k, j
(xik - X k ) ( x j , - Z j )
S,, =
1,2
(15-47)
i= I
x'x,
ecuacin 15-47, es
(15-49)
donde
(15-51)
u=l
+ b 2 z i 2+
E:
(15-52)
599
Y , -7
s1/2
YY
Zi/ =
x I- .- XI
~
SA,
j = 1,2
(15-53)
(15-54)
Po = - P l X l - P2X2
(15-55)
b, =
r1.v - r12r2y
1 - r:,
(15-57a)
(15-576)
Los coeficientes de regresin, ecuaciones 15-57, suelen llamarse coeficientes
regresidn estandarizados. Muchos programas de computadora de regresi6n
Nltiple usan esta transformacin para reducir errores de redondeo en la matriz
600
(XX)-.
Estos errores de redondeo puedenser muy serios si las variables originales difieren en magnitud de maneraconsiderable. Algunos de estos programas
de computadora tambin presentan tanto
los coeficientes de regresin originales
como los coeficientes estandarizados. Los coeficientes de regresin estandarizados son adimensionales,y esto puede facilitarla comparaci6n de coeficientes de
regresin en situaciones en las que las variables originales xj difieren considerablemente en sus unidades de medida. Sin embargo, al interpretar estos coeficientes de regresi6n
estandarizados, debemos recordar que son todava coeficientes de regresin parciales (es decir,
b, muestra el efecto dezj dado que otraszi,
i # j , estiin en el modelo). Ademfis las bj resultan afectadas por el espaciamiento
de los niveles delas xj. En consecuencia, no debemos utilizarla magnitud de las
bj como medida de la importancia de las variables regresoras.
Si bien s610 hemos tratado enforma explcita el casodedosvariables
regresoras, los resultados se generalizan. Si hay k variables regresoras x , , x*, . . . ,
xk, puede escribirse la matrizXX en forma decorrelacin como
rz
r12
r13
Ilk
r13
i3
Zk
.
(15-58)
..
r3k
,(xui -Xi)
(1 5-59)
^b = Rg
(15-60)
S,, = 698.5600
601
Sl,,= 2027.7132
S, = 780,230.5600
S,,, = 34,018.6668
S, = 8834.4400
En consecuencia,
8834.4400
( SllS22)1/2/(698.5600)(780,230.5600)
S12
r12 =
r1.r -
rz? -
S,
2027.7132
( S11Svr)1/2 /(698.5600)(6105.9447)
S2.V
.378413
.981812
34,018.6668
( S,,S,,)/2
{(780,230.5600)(6105.9447)
.492867
[ .3781413
.378413]
.37:413
[& ] [
=
.981812]
.492867
[ill [
=
[
[
.378413
.37:413
1.16713
1-[
- .M166
.981812]
][
.492867
.981812]
- .44166
1.16713
.492867
.928223
.141615]
CAPITULO
MLTIPLE15 REGRES16N
602
En la mayor parte de los problemas de regresin mltiple, las variables independientes o regresoras x, esthn intercorrelacionadas. En situaciones en las que
esta intercorrelacin esmuy grande, afirmamos que existemulticolinearidad. La
multicolinearidad puede tener serios efectos
en las estimaciones de los coeficientes de regresin y en la aplicabilidad general del modelo estimado.
Los efectos de la multicolinearidad pueden demostrarse con facilidad. Considrese un modelo de regresin con dos variables regresorasx, y x2, y supongase
que x, y x2 se han estandarizado comoen la seccin 15-9, de modo quela matriz
XX est en forma de correlacin, como en la ecuacin 15-49. El modelo es
A=
x;Y - I2x;Y
1 - r;2
x;Y
r12x;y
r;2
donde
es la correlacin simple entre xI y x2,y xly y x;y son los elementos del
vector Xy.
Luego, si lamulticolinearidadestpresente, x, yx, estn muy correlacionados,
y
-+ 1. En tal situacin, las varianzas y las covarianzasde los coeficientes
de regresin se vuelven muy grandes, puesto que V ( 8 ) = C,d + cuando jr,*j
+ 1, y C O V ( ~b2)
, , = C,2(T *
t = dependiendo desi r12
+ 2 I . Las grandes
varianzas para
implican que los coeficientes de regresin se estimaron muy
pobremente.Nteseque
el efectode la multicolinearidad es introducir una
dependencia casi lineal en las columnas de la matriz X. Cuando R12-+ +- 1,
-+
15-10
603
-a,
(15-62)
donde Rj es el coeficiente de determinacin mltiple que resulta de laregresin
de xi sobre las otras k - 1 variables regresoras. Es claro que cuantomhs fuerte sea
la dependencia lineal de x, en las variables regresoras restantes (y, en consecuencia, multicolinearidad ms fuerte), tanto ms grande ser el valor de Rj. Afirmamosque la varianzade $ est inflada por la cantidad (1 I?;). Consecuentemente, solemos llamar
(15-63)
el factor de inflacin de la varianza para $. Ntese que estos factores son los
elementos de la diagonalprincipal de la inversa de la matriz de correlacin.Hay
una medida importante del grado al que sepresenta la multicolinearidad.
A pesar de que las estimaciones de los coeficientes de regresin son muy
imprecisas cuandola multicolinearidad estpresente, la ecuacin estimada puede
seguir siendo til. Por ejemplo, supngase que deseamos predecir nuevas observaciones. Si estas prediccionesson requeridas en la regin del espacio x donde la
multicolinearidad en efecto estpresente, entonces a menudo seobtendrn resultados satisfactorios porque, en tanto que las P, pueden ser estimadaspobremente,
la funcin
J3; x,,puede estimarse bastante bien. Por otra parte, si la prediccin
de nuevas observaciones requiere extrapolacin, entonces en general esperaramos obtener resultados pobres. La extrapolacin usualmente requiere buenas
estimaciones de los parmetros individuales del modelo.
La multicolinearidad surge por varias razones. Ocurrir cuando el anlisis
recaba los datos de manera tal que secumple una restriccin de la forma
k
X,=
,a,x, = O entre las columnas de la matriz X (las a, son constantes, no todas
cero). Por ejemplo, si cuatro variables regresoras son las componentes de una
mezcla, entonces una de talesrestricciones siempre existirporque la suma delas
componentes siempre es constante. Usualmente, estas restricciones no se cumplen
en forma exacta, y el analista no sabe que existen.
Hay varios modos de detectar l a multicolinearidad. Algunos de los ms
importantes se analizarn brevemente.
.-._I-
604
15-10
605
razones econmicas, o debido a las restricciones fsicas que relacionan las xj. Otra
posibilidad es eliminar ciertas variables del modelo. Esto tiene la desventaja de
descartar la informacin contenida en las variables eliminadas.
Puesto que la multicolinearidad afecta principalmente la estabilidad de los
coeficientes de regresidn, parecera que la estimaci6n de estos parmetros por
algn mCtodo que sea menos sensible a la multicolinearidad que los mnimos
cuadrados ordinarios sera deutilidad. Se han indicado varios metodos para esto.
Hoerl y Kennard (1970a, b) han propuesto la regresin de arista como una
alternativa para los mnimos cuadrados ordinarios. En la regresin de arista, las
estimaciones de los parmetros se obtienen resolviendo
(15-64)
606
XX
1.00000 34894
.91412
.76899
34894 1.00000
.91412
.76899 1.00000
36784
.93367
.97567
.93367
.97567
.86784
1.00000
(XX) -
25 313
74.486
12.597
- 107.710
20.769
25 313
-. .608
- 44.042
- .608
12.597
8.274
- 18.903
- 44 .O42
-107.710
- 18.903
163.620
Nmero de
observacin
1
2
3
4
5
6
7
36
8
9
10
11
38.92
36.70
15.31
8.40
12
13
14
15
Y
28.25
24.8035
11.86
36.6042
15.80
16.23
12 29.50
28.75 34
43.2040
38.47
10.1437
40
45
Z1
z2
z3
24
10
12
5
17
8
6
31
5
5
3
9
5
3
6
5
10
10
5
45
52
24
65
19
25
55
50
10
18
23
16
20
15
7
9
15
6
17
70
50 80
11
22
12
8
2
3
61
70
68
30
24
607
Nmero de
observacibn
28.25
24.80
11.86
36.60
15.80
16.23
29.50
28.75
43.20
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
38.47
38.92
36.70
15.31
8.40
x2
X1
10.14
- .12515
- ,02635
,37217
,22066
- .22396
- .32276
- ,02635
- .12515
,27007
.51709
.17126
,36887
.12186
- ,27336
- ,17456
-
,00405
,08495
- .31957
,22653
- .50161
- ,27912
.lo518
.O6472
.1 8608
,38834
,12540
.1 8608
.28721
- ,17799
- .38025
x4
x3
- ,09206
- ,09206
- ,27617
.27617
- .O9206
- ,27617
.00000
- ,09206
,36823
.36823
- .O9206
.46029
,18411
- ,36823
- .27617
.O5538
.O3692
- ,33226
.20832
- ,39819
- ,31907
.O7647
.O1055
.27425
.40609
.15558
.27425
,24788
- .25315
- ,33226
-
Los factores de inflacin dela varianza son los elementos de la diagonal principal
de esta matriz. Ntese que tresde los factores de inflaci6n de la varianza exceden
de 10, unabuena indicacin de quelamulticolinearidadestpresente.Los
eigenvalores de X'X son A, = 3.657, iz, = .2679, A, = .07127, y A., = .004014.
Dos de los eigenvalores, 4 y A,, son relativamente cercanos a cero. Adems, la
razn del eigenvalor ms grande al miis pequeiio es
-="-
&,m
TABLA 15.14
.o01
.O02
.O04
.O08
.O16
.O32
.O64
.128
.256
,512
.O04014
911.06
P:(l)
I
.O00
3.657
28.3318
31.0360
- 32.6441
- 34.1
O71
- 34.3195
- 31.971O
- 26.3451
- 18.0566
- 9.1
786
- 1.9896
2.4922
-
KC/>
KC/>
65.9996
64.0479
57.0244
61.9645
60.3899
50.9649
58.0266
43.2358
54.7018
35.1426
27.9534
50.0949
22.0347
43.8309
17.2202
36.0743
13.4944
27.9363
20.8028
10.9160
9.2014
15.31
97
P4*(/)
- 57.2491
- 44.0901
- 35.3088
- 24.3241
- 13.3348
- 4.5489
1.2950
4.7242
6.5914
7.5076
7.7224
CAPITULO
608
15 REGRESI~N
MULTIPLE
-50
-60
.O5
.10
.15
.20
.25
.30
.35
.40
.45
.50
,551
= 25.53
9 = 2.9913 -
609
las observaciones
excepto la iesima I
II
I
I
I
xi t
-"
X1
61O
btI)cambie en
p.
(15-65)
X(XX) -X
g = xj3
=
=
X ( X X ) - lXy
Hy
= - [e-/
(1 - h,I)
- [1.57/{5.2352(1 - 0.1573)
3
0.035
1,
0.1573
(1 - 0.1573)
15-10 PROBLEMAS
EN
611
stancia de
37
LA REGRES16N
MULTIPLE
Observaci6n
Medida
i
0.021
0.007
1
2
3
4
5
6
hi
7
8
9
10
11
12
13
14
15
16
17
18
0.1
19
20
210.052
22
230.002
24
25
0.1 573
0.1116 2
0.1419
0.1o1
Di
0.035
0.01
0.060
0.024
0.0749
0.1181
0.1561
O. 1280
0.041 3
0.0925
0.0820
0.1 129
0.0879
0.2929
0.0962 8
0.1473
O. 1296
0.1 358
O. 1824
0.1 o91
0.036
0.020
0.1 60
0.001
0.013
0.001
0.001
O. 003
0.1 87
0.001
0.565
55
0.01
0.000
0.028
0.040
0.000
La medida de distancia de Cook Di no identifica ninguna observaci6n potencialmente influyente en los datos, ya que ningn valor de Di excede la unidad.
15-10.3 Autocorrelacin
Los modelosde regresin desarrollados hasta ahorahan supuesto que las componentes de error del modelo son variables aleatoriasno correlacionadas. Muchas
aplicaciones del anlisis de regresin involucran datos para loscuales esta
suposicinpuederesultar inapropiada. En problemas de regresidn dondelas
variables dependientes e independientes se orientan al tiempo o son datos de
seriesde tiempo, lasuposicin de errores no correlacionadoses a menudo
insostenible. Por ejemplo, supngaseque retrocedemos las ventas trimestrales
de
un producto contra los gastos de publicidad trimestrales para cada venta. Ambas
variables son series de tiempo, y si ellas se relacionan de manera positiva con
CAPITULO
15 REGRESI~N
MLTIPLE
612
(1S-66)
donde t es el ndice del tiempo ylos tdrminos de error se generan de acuerdo con
el proceso
E , = pEr_l
(1S-67)
H,: p = O
H,: p > O
(15-68)
(15-69)
61 3
Tarnaiio
de la
muestra
'robabilidad en
la cola inferior
Nivel de significaci6n = a)
15
.o1
,025
.O5
20
.o1
.O25
.O5
25
.o1
.O25
.O5
.o1
30
.O25
.O5
.o1
40
.O25
.O5
.o1
50
.O25
.O5
60
.o1
.O25
.O5
80
.o1
.O25
.o5
.o1
O0
.O25
.O5
l-
9,
.81 1.O7
.95 1.23
1.08 1.36
9,
.70 1.25
.83 1.40
.95 1.54
1.46
1.61
1.75
DL
.49
59
.69
1.70
1.84
1.97
Du
.39 1.96
.48 2.09
56 2.21
1.41
1.55
1.00 1.68
59
.71
.82
Du
.95 1.15
.86
1.08 1.28
.99
1.20 1.41 1.10
.27
.41
54
.63
.79
.90
1.57
1.70
1.83
.60 1.74
.70 1.87
.79 1.99
1.05 1.21
1.13 1.34
1.20 1.45
.83
.30
.90 1.41
.94
.43 1.02 1.54
.55 1.12 1.66 1.04
1.52
1.65
1.77
.75 1.65
.86 1.77
.95 1.89
.98
1.10
1.21
.77
.89
.94 1.51
1.01 1.42
.88 1.61
1.12 1.54 1.05 1.63
.98 1.73
1.21 1.65 1.14 1.74 1.07 1.83
.34
.46
57
1.35
1.44
1.51
1.25 1.60
1.33 1.69
1.41 1.77
1.62
1.69
1.67
1.74
1.44
1.51
1.70
1.77
614
615
f?:contra p.
616
k+l
617
-1sesgo)Z + varianza]
ts2
(15-71)
Si el modelo de
p trminos tiene sesgo despreciable,
puede demostrarse entonces
que
E ( Cplsesgo cero) = p
Por tanto, los valores de C, para cada modelo de regresin bajo consideraci6n
deben graficarse contrap . Las ecuaciones de regresi6n que tienen sesgo despreciable tendrhn valores de C, que caen cerca de la linea C, = p , en tanto que
aqullas con sesgo significativotendrn valores de C, graficados sobre esta lnea.
En consecuencia se elige como
la "mejor" ecuacin de regresi6n ya sea un
modelo con C, mnimo o un modelo con un C, ligeramente ms grande que no
contiene tanto sesgo (es decirC, Z p ) como el mnimo.
Otro criterio se basa en una modificaci6n de R; que explica el nmero de
variables en el modelo. Esta estadstica se denomina la R; ujustudu definida como
75; = 1 - "n(1- 1
- R;)
(15-72)
U - P
e.
618
Ejemplo 15.16 Los datos de la tabla 15.17 son un conjunto de datos ampliado
para el estudio del tiempo de entrega derefrescos en el ejemplo 15.1. Ahora hay
cuatrovariablescandidatas,el
volumen deentrega (xl), la distancia ( x p ) , el
nmero de mquinas vendedoras en la salida (xg), y el nmero de ubicaciones
diferentes de las mquinas (x4).
TABLA 15.17 Datos del tiempo de entrega de refrescos para el ejemplo 15.16
~~
Nmero
Nmero
Tiempo
entrega
de latas
deDistancia
maquinas
Observacin
Y
X1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
9.95
110
24.45
31.75
35.00
25.02
16.86
14.38
9.60
24.35
27.50
17.08
37.00
41.95
11.66
21.65
400
17.89
69.00
10.30
34.93
250
46.59
44.88
54.12
56.63
22.1 3
21.15
2
8
11
10
x2
50
8
4
2
2
9
8
4
11
12
2
4
4
20
1
10
15
15
16
17
6
5
de
1
2
3
120
550
295
200
375
52
1O0
300
41 2
400
500
360
205
600
585
540
290
51 O
590
1O0
400
Nmero de
ubicaciones
de mquinas
x3
x4
1
1
2
2
1
1
1
1
1
2
1
1
1
2
1
1
1
1
1
3
3
1
2
2
4
1
2
3
3
3
2
2
1
1
2
1
1
1
2
1
3
2
1
619
TABLA 15.18 Todas las regresiones posibles para los datos en el ejemplo 15.1 6
Nmero de
variables
Variables
en
en
el modelo p et modelo
1
2 x2
1
2 x4
1
2 x3
1
2 x,
3
3
3
3
4
4
4
4
2
2
2
2
2
2
3
3
3
3
4
Xp,x4
~ 2 ~ x 3
x3,x4
XI,x3
X,, x2
x1>x4
x2,x3,x4
x,,x3,x4
X , , ~ 2 x3
,
xl.xp,x4
5 xl,x2,x3,
x4
S%P)
R,'
,24291747
56007492
,39830969
,96395437
1483.2406
3419.7865
4263.8404
5885.8521
MWP)
R,'
c,
,5326
,6963
.6971
,9697
,9794
.9815
830.35
532.88
531.49
36.11
18.40
14.64
77.6354
4.8618
4.3105
3.0196
,6948
.9809
.9831
,9881
512.35
16.15
12.39
3.59
,73299076
.98327895
,98517507
,98961493
4475.6010 1630.3437
6003.8469 102.0978
6015.4245
90.5203
6042.5340
63.4107
~~
,98991196
6044.3477
61.5970
3.0798
.9879
e,
620
x1
El mejor modelo de dos variables es (xl, x2) o (x1,x4), y el mejor modelo de tres
variables es (xl, .x2, x4). Los valores mnimos de MS,( p ) ocurren para el modelo
de tres variables (x,, x2,x4). Si bien hay varios otros modelos que tienen valores
relativamente pequefios de MS,( p ) , tales como (x1, x2, xj) y (xl,x?), el modelo (xl,
x*,x4) es en definitiva superiorcon respecto al criterio M&( p ) . Adviertase que,
comose esperaba, estemodelotambitn maximiza la
ajustada. Una grhfica
de C, se muestra en la figura 15.13. El nico modelo con C, p es la ecuacin
de tres variables en (xl, x2, x4). Para ilustrar los clculos, para esta ecuacin
encontraramos que
63.4107
25 + 2(4) = 3.59
3.0799
notando quea2= 3 .O799 se obtiene de la ecuacin completa (x,, x*,xj, x4). Puesto
que todos los dems modelos contienen un sesgo sustancial, concluiramos con
base en elcriterio de C, que el mejor subconjunto de variables regresoras es (xl,
x2, x4). En vista de que este modelo tambin resulta en una MSE( p ) mnima y en
una R,?, alta, lo seleccionaramoscomo la mejor ecuacin de regresin. El
modelo final es
=--
1.36707
+ 2.53492~,+ , 0 0 8 5 +~ ~2 . 5 9 9 2 8 ~ ~
x , = 50.46
621
x j , x., = 16.15
x,, x? = 18.40
CAPTULO 15 REGRES16NMLTIPLE
622
Coeficiente de rearesi6n
Estadstica
22.57
X1
2.48423
x2
.O0855
x3
.62237
2.29392
3.06
x4
3.63
.77
Puesto que los valores ms grandes de t (en orden descendente) son para las
variables ,x1, x? y x4, esto implicara que necesitamos construir tres modelos de
regresin adicionales: uno con xl, otro con x I y x2, y uno m& con xl, x2 y x,. Lo
anterior genera los siguientes datos.
Variables en modelo
X1
x1 9 x2
x13 x91
CP
50.46
18.40
3.59
623
624
x1 se introduce en el modelo.
-x4
625
,,
626
Ejemplo 15.20 Para aplicar la eliminaci6n hacia atrs a los datos en la tabla
15.17, empezamos estimando el modelo completo en la totalidad de las cuatro
variables. Este modelo es
j
1.06813
+ 2 . 4 8 4 2 3 ~+~ .o0855x2+
509.36
13.15
.59
9.39
15-12
SALIDA DE COMPUTADORA
DE
LA MUESTRA
627
Y
SSR(&l/3,, /I,) = 104.91915203
628
N
N
-1
4
629
.%
c
a -wI
>
w
= >u
v)
0o
o
0
oo
0
o o0
oo0
oo0
oo0
oo 0
o
o0
oo
0o
0
o o0
oo0
oo0
oo0
oo 0
o
o0
oo
0o
0
oo
0
oO0
oo0
oo0
o'0
o0
o~
~
00
00
00
00
00
00
00
00000
00
00
00
00
00
00 00
00
00
00
00
00
000 0 ~
0
.
0 0
0
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 ~
8a
a
Q
U
.-
v)
O
l-4
I-
<
5
V,
m
O
630
w
u 0
2 -
U I u 4
m-I
4 u
'5
. . -
O 0 0 0
u*
> x
I-
O
m
n
.. o
I1
m
m u
o +
Y W
v)
I4
I - 24
w
Iw
w
~
u
z
sc
U
m
m
4
>
I-
Iv)
v)
v)
W
ncL
m 0
u m
n m
z
4
I-
>-
I-
CL
4
v)
-I
J
m w
WI-
I-4
u +
U W
>
m m
*o
*
N N
w z
m 4
E
L
-
J
.
m
4
m
4
>
>
W
m
4
m
4
>
o
W
n:
631
CAPITULO
632
15 REGRESI~NMLTIPLE
REGRESSION
ERROR
TOTAL
B
INTERCEPT
SUM
SQUARES
OF
1
23
24
5885.85206919
5885.85206919
615.08
0.0001
220.09263481
9.56924499
6105.94470400
VALUE
DF
2
22
24
B VALUE
2.64573312
2.54772805
3.54854459
INTERCEPT
x1
x4
REGRESSION
ERROR
TOTAL
3
21
24
B VALUE
INTERCEPT
x1
x2
x4
1.36706835
2.53491 873
0.00852152
2.59927756
SS
I1
TYPE
PROB>F
PROB>F
0.11704072
5885.85206919
615.08
0.0001
1,
1
R SQUARE =0.98302963
OFSUM
SQUARES
MEAN
C(P)
SQUARE
= 14.64453722
F
PROBbF
PROB>F
6002.32458234
3001.16229117
637.19
0.0001
103.62012166
4.71000553
6105.94470400
STD
ERROR
I T1Y P E
SS
2582.53810667
116.47251315
0.15880288
0.71359082
0.0001
0.0001
548.31
24.73
1.755752,
7.023007
R SQUARE = 0.98961493
VARIABLE X2 ENTERED
DF
MEAN SQUARE
STD ERROR
VARIABLE X4 ENTERED
REGRESSION
ERROR
TOTAL
C(P)=50.46213232
DF
5.11451557
2.90270442
x1
STEP 2
R SQUARE=0.96395437
VARIABLE X 1 ENTERED
OFSUM
SQUARES
c ( P ) =3.5888877
MEAN SQUARE
0.0001
6042.53402205
2014.17800735
667.04
63.41068195
3.01955628
6105.94470400
STD
ERROR
I T1Y P E
SS
0.0871a736
2552.49064020
845.32
40.20943970
0.00233520
51 .76280083
0.62779136
2.119696,
15.86207
PROB>F
13.32
17.14
PROB>I
0.000
0.001
O. O00
S"ARY
OF
FORWARD
VARIABLE
NUMBER
ENTERED
IN STEP
x1
PARTIAL
R**2
1 0.9640
0.0191
2
0.0066
3
x42
x2
3
C(P)
PROB>F
0.9640
0.9830
0.9896
50.4621
14.6445
3.5889
615.0801
24.7287
13.3163
0.0001
0.0001
0.0015
FOR DEPENDENTVARIABLE
R SQUARE=0.98991196
C(P)
=5.00000000
VARIABLES
ALL ENTERED
OFSUMDF
4
20
REGRESSION
984981
ERROR61.59699625
TOTAL
MODEL
R**2
BACKWARD ELIMINATIONPROCEDURE
STEP 0
633
VALUEB
SQUARES
MEAN SQUARE
6044.34770775
1511.08692694
490.64
0.0001
TYPE I1 S S
STD ERROR
PROB>F
PROB>F
405INTERCEPT
x1
u2
(3
(4
0.0017
2.48423244
13.15
40.50082723
0.00235877
0.00855369
0.81102045
0.62236914
2.29392355
IOUNDS
ON
CONDITION NUMBER:
:TEP 1
VARIABLE X3 REMOVED
0.11007295
1568.74664163
509.36
0.0001
1.81368571
0.4518
0.59
0.74854920
28.92322543
0.0061
9.39
3.980888,
44.3724
R S Q U A R E = 0 . 9 8 9 6C1(4P9)3= 3 . 5 8 8 8 8 7 7 1
SUM DF
EGRESSION
RROR
DTAL
21
VALUEB
OF SQUARES
6042.53402205
2014.17800735
667.04
0.0001
3.01955628
63.41068195
STD ERROR
1 .36706835
2.53491873
0.08718736
0.00852152
0.00233520
2.59927756
0.62779136
51.76280083
17.14
STERCEPT
I
MEAN
PROB>F
SQUARE
F
I1TYPE
SS
2552.49064020
40.20943970
845.32 0.0001
1 3 . 3 2 O .O01 5
0.0005
2.119696,
15.86207
STEP
VARIABLE
REMOVED
PROB>F
NUMBER
IN
PARTIAL
R**2
MODEL
R**2 F
C(P)
PROB>F
CAP~TULO
15
634
STEPWISEREGRESSIONPROCEDURE
NOTE:SLSTAYHASBEENSETTO
STEP 1
DF
R SQUARE = O -96395437
SUN OF SQUARES
B VALUE
INTERCEPT
STD ERROR
5.11451557
2.90270442
1,
B VALUE
2.6457331 2
2.54772805
3.54854459
INTERCEPT
x4
BOUNDSON
STEP 3
3
21
24
INTERCEPT
NO OTHERVARIABLESMETTHE
TYPE I1 S S
0.10880288
0.71359082
2582.53810667
116.47251315
MEAN SQUARE
6042.53402205
2010.17800735
63.41068195
3.01955628
6105.94470400
STD ERROR
1.36706835
2.53491873
52O. 008521
2.59927756
PROB>F
= 14.64453722
F
PROB>F
637.19
0.0001
STD ERROR
SUM O F SQUARES
B VALUE
x1
x2
x4
C(P)
MEAN SQUARE
VARIABLE X2 ENTERED
REGRESSION
ERROR
TOTAL
PROB>F
PROB>F
F
548.31
24.73
0.0001
0.0001
1.755752,
7.023007
CONDITION NUMBER:
DF
TYPE I 1 S S
6002.32458234
3001.16229117
103.62012166
4.71000553
61 05 -94470400
2
22
24
x1
SUM OF SQUARES
DF
MEAN SQUARE
R SQUARE = 0.98302963
VARIABLE X4 ENTERED
REGRESSION
ERROR
TOTAL
= 50.46213232
0.11704072
5885.85206919
615.08
0.0001
C(P)
5885.85206919
5885.85206919
615.08
0.0001
220.09263481
9.56924499
6105.94470400
1
23
24
x1
. I 5 FOR THESTEPWISETECHNIQUE.
VARIABLE X1 ENTERED
REGRESSION
ERROR
TOTAL
REGRESIONM ~ L T I P L E
0.08718736
0.00233520
0.62779136
2.11 9696,
0.1000
TYPE SS
I1
2552.49064020
40.20943970
51.76280083
C(P)
= 3.58888771
F
PROB>F
667.04
0.0001
PROB>F
F
845.32
13.32
17.14
O. 000'
0.0011
0.000'
15.86207
SIGNIFICANCELEVEL
FOR ENTRYINTOTHE
Figura 15.16 Salida del PROC ESCALONADA y PROC RCUADRADA del SAS para los
datos de refrescos (continuacidn).
MODE
635
SUMMARY OF STEPWISE
REGRESSION
PROCEDURE
STEP
VARIABLE
NUMBER PARTIAL
ENTERED REMOVED
IN
R**2
1 x1
2 x4
3 x2
N = 25
NUMBER IN
MODEL
I 0.9640
0.0191
2
0.0066
3
FOR DEPENDENT
VARIABLE
MODEL
R**2
C(P)
PROB>F
0.9640
0.9830
0.9896
50.4621
14.6445
3.5889
615.0801
24.7287
13.3163
0.0001
REGRESSION
MODELS
FOR
DEPENDENT
R
- SQUARE
OO
. OOI
0.0015
VARIABLE: Y MODEL:
MODEL1
C(P)
VARIABLESIN
MODEL
1
1
1
1
0.24291747
0.56007492
0.69830969
0.96395437
1479.951
851.172
577.115
50.462132
x2
x4
x3
x1
2
2
2
2
2
2
0.57158123
0.72162460
0.72232683
0.97220237
0.9811374a
0.98302963
830.360
x4
x3
532 -892
531 -500
36.110087
18.395811
14.644537
x2
x2
x3
x1
x1
x1
x4
x3
x2
x4
3
3
3
3
0.73299076
0.98327895
0.98517507
o -98961493
x4512.358
x3
16.150260
12.391116
3.588888
x2
x1
x4
x1
x1
x4
x3
X2
x2
x3
o -98991I96
5.000000
x1
x2
x3
X4
Figura 15.16 Salida del PROC ESCALONADA y PROC RCUADRADA del SAS para los
datos de refrescos (continuacidn).
CAPiTULO 15 REGAESldNMLTIPLE
630
15-13 Resumen
En este captulo se present
la regresin lineal mltiple, incluyendo la estimacin
de parmetros por mnimos cuadrados, la estimacin de intervalo, la prediccin
de nuevas observaciones ymtodos para la prueba de hiptesis. Sehan estudiado
diversas pruebas dela suficiencia de los
modelos, incluso las grficas de residuos.
Se dio una extensin de la prueba de falta de ajuste para la regresin mltiple,
empleando pares de puntos que son vecinos cercanos para obtener una estimacin
del error puro. Se demostr que los modelos de regresin polinomial pueden
manejarse mediante los mtodosusuales de regresin lineal mltiple. Se presentaron lasvariablesindicadoras
para tratar variables cualitativas. Se observ
tambin que el problema demulticolinearidad, o intercorrelacin entre las variables regresoras, puede complicar en gran medida el problema de la regresin y
que a menudo conduce a un modelo de regresin que es posible que no prediga
de maneraadecuada nuevas observaciones.Se estudiaron diversascausas y
procedimientos correctivos de este problema como las tcnicas de estimacin
sesgada. Por ltimo, se present el problema de la seleccin de variables en la
regresin mltiple. Asimismo, se ilustraron varios procedimientos de construccin de modelos, entre los que se incluyen el de todas las regresiones posibles, la
bsqueda directa en t , la regresin escalonada, la seleccin hacia adelante y la
eliminacin hacia atrs.
15-14
Ejercicios
15-1 Considere los datos del tiempo de entrega de refrescos en la tabla 15.17.
a) Ajuste un modelo deregresin empleando x, (volumen de entrega) y x, (nmero
de ubicaciones de m6quina) a estos datos.
6) Pruebe la significacin de la regresih.
637
15-14 EJERCICIOS
Equipo
Washington
Minnesota
New England
Oakland
Pittsburgh
Baltimore
Los Angeles
Dallas
Atlanta
Buffalo
Chicago
Cincinnatti
Cleveland
Denver
Detroit
Green Bay
Houston
Kansas City
Miami
New Orleans
New York Giants
New York Jets
Philadelphia
st. Louis
San Diego
San Francisco
Seattle
Tampa Bay
x2
x3
102113198538.964.7
1 1 2003 2855 38.8
1 1 2957173740.1
13 2285 2905 41.6
1 O 2971 1666 39.2
1 1 2309 2927 39.7
102528234138.1
1 1 2147 2737 37.0
4 1689 1414 42.1
2 2566 1838 42.3
7 2363 1480 37.3
10 2109219139.5
9 2295 2229 37.4
9 1932 2204 35.1
6 2213 2140 38.8
5 1722 1730 36.6
5 1498 2072 35.3
5 1873 2929 41.1
6 2118 2268 38.2
4 1775 1983 39.3
3 1904 1792 39.7
3 1929 1606 39.7
4 2080 1492 35.5
10 2301 2835 35.3
6 2040 2416 38.7
8 2447 1638 39.9
2 1416 2649 37.4
O 1503 1503 39.3
x4
61.3
60.0
45.3
53.8
74.1
65.4
78.3
47.6
54.2
48.0
51.9
53.6
71.4
58.3
52.6
59.3
55.3
69.6
78.3
38.1
68.8
68.8
74.1
50.0
57.1
56.3
47.0
x5
+4
+3
+14
-4
+ 15
+8
+ 12
-1
-3
-1
+ 19
+6
-5
+3
+6
- 19
-5
+ 10
+6
+7
-9
-21
-8
+2
O
-8
-22
-9
x7
x8
x9
86859.722051917
615 55.0 2096 1575
914 65.6 1847 21 75
957 61.4 1903 2476
836 66.1 1457 1866
786 61.O 1848 2339
754 66.1 1 564 2092
761 58.0 1821 1909
714 57.0 2577 2001
797 58.9 2476 2254
984 67.5 1984 221 7
700,57.2 1917 1758
1037 58.8 1761 2032
986 58.6 1709 2025
819 59.2 1901 1686
791 54.4 2288 1835
776 49.6 2072 1914
789 54.3 2861 2496
582 58.7 241 1 2670
901 51.7 2289 2202
734 61.9 2203 1988
627 52.7 2592 2324
722 57.8 2053 2550
683 59.7 1979 21 10
576 54.9 2048 2628
848 65.3 1786 1776
684 43.8 2876 2524
875 53.5 2560 2241
638
15-2 Considere los datos del tiempo de entrega derefrescos en la tabla IS. 17.
a) Ajuste un modelo de regresin empleando x, (volumen de entrega), x2 (distancia), y xj (nmero de mhquinas) para estos datos.
6) Pruebe la significacibn de la regresin.
c) Calcule los residuosde este modelo. Analiceestosresiduosempleando
los
metodos estudiados en este captulo.
15-3 Con el empleode los resultados del ejercicio 15-1, encuentre un intervalode
confianza del 95 por ciento sobrep4
15-4 Mediante la utilizacin de los resultados del ejercicio 15-2, encuentre un intervalo
de confianza del95 por ciento sobre h.
Rendimiento de gasolina por milla para25 automdviles
Nova
Monarch
Duster
Jenson Conv.
Skyhawk
Scirocco
Corolla SR-5
Camaro
Oatsun 821 O
Capri I I
18.90
20.00
18.25
20.07
11.2
22.12
34.70
30.40
16.50
36.50
21 5 0
x2
350
165
250
105
143
351
95
225
215
440
231
110
89.7 70
96.9 75
350
155
85.3 80
171
109
Pacer
Granada
Eldorada
Imperial
Nova LN
Starfire
Cordoba
Trans Am
Corolla E-5
Mark IV
Celica GT
Charger SE
19.70
17.80
14.39
14.89
17.80
23.54
21.47
16.59
31.90
13.27
23.90
19.73
110
195
8.O:l
3.08:l
129 220
190
360
500
215
330
440
155
250
350
175
110
231
1802908.4
360
185 NA
400
96.9 75 83
223 366
460
133.6 961208.4:
140 255
31 8
Cougar
corvette
13.90 351
16.50 350
autom6vil
Apollo
x3
260
185
255
170
330
175
81
83
250
83
146
258
302
x5
X6
x7
2.56: 1
2.73: 1
3.00:l
2.76:l
2.88 : 1
256:l
3.90: 1
4.30:l
3.08: 1
3.89:l
3.22:l
4
1
2
1
4
2
2
2
4
2
2
3
3
3
3
3
3
4
5
3
4
4
200.3
196.7
199.9
194.1
184.5
179.3
155.7
165.2
195.4
160.6
170.4
x11 x10
69.9 3910
72.2 3510
74.0 3890
71.8 3365
69
4215
65.4 3020
1905
64
2320
65
74.4 3885
62.2 2009
66.9 2655
1
2
4
4
4
2
2
4
2
4
2
2
3
3
3
3
3
3
3
3
5
3
5
3
171.5
199.9
224.1
231.0
196.7
179.3
214.2
196
165.2
228
171.5
215.3
77
74
79.8
79.7
72.2
65.4
76.3
73
61.8
79.8
63.4
76.3
3375
3890
5290
5185
3910
3050
4250
3850
2275
5430
2535
4370
8.0: 1 3.0:l
8.5: 1 2.73: 1
8.2: 1 2.71 : 1
8.5:l
3.08:l
8.0:l
2.56:l
:1
2.45 : 1
7.6:l
3.08:1
9.0: 1 4.30: 1
8.0: 1 3.00: 1
1 3.91 : 1
8.5: 1 2.71 : 1
2
4
3
3
A
A
x4
8.0: 1
8.25: 1
8.0:l
8.4:l
8.2 : 1
8.0:l
8.2: 1
9.O:l
8.5:l
8.5:l
8.2: 1
y: Millaslgal6n
x,: Cilindraje (pulgadas cbicas)
m:Caballos de fuerza (pie-lb)
m:Momento de torsidn(pie-lb)
x,: Raz6n de compresi6n
xs: Raz6n del eje trasero
xs: Carburador {gargantas)
m:Nom de velocidades de la transmisi6n
a:Longitud total (pulgadas)
XO: Ancho (pulgadas)
.mo: Peso (lb)
xll:Tipo de transmisidn (A-automAtica. M-manual)
3.25 : 1
2.73: 1
A
A
M
A
A
M
M
A
M
M
A
A
A
A
A
A
A
M
A
M
A
639
15-14 EJERCICIOS
Ajusteunmodeloderegresibnmltiplequerelacioneelnmero
de juegos
ganados con las yardas por pase de los equipos (x2), el porcentaje de jugadas
por corrida(x7) y las yardas por corrida de
los oponentes (x8).
b) Construya las grXtcas de residuos apropiadas y comente acerca de la suficiencia
del modelo.
c ) Pruebe lassignificacih de cada variable en el modelo, empleando la prueba de
t o la prueba de
F parcial.
15-6 La tabla anterior presenta el rendimiento de gasolina por milla en
(Fuente: Motor Trend, 1975).
25 autom6viles
a)
Ajusteunmodeloderegresibnlinealmltiplequerelacioneelconsumode
(x,) y el nmero de gargantas del
gasolina por milla con el cilindraje del motor
carburador (&).
b) Analice los residuos y comente acerca de la suficiencia del modelo.
c ) cual es el valor de afadirx6 al modelo que ya contienea x,?
15-7 Se piensa que la energa el6ctrica que consume mensualmente
una planta qumicase
240
236
290
274
301
316
300
296
267
276
288
261
a)
X1
x2
x3
x4
25
24
21
24
25
25
26
25
25
24
25
25
23
91
90
88
87
91
94
87
86
88
91
90
89
1 O0
95
110
88
94
99
97
96
110
1 05
1 O0
98
31
45
60
65
72
80
84
75
60
50
38
d) Calcule
los
residuosdeestemodelo.Analice
mCtodos estudiados en este captulo.
5-8
los
fi4
= O.
residuosempleando los
x3, x4).
640
Nmero de
observaci6n
Y
78.5
74.3
104.3
87.6
95.9
109.2
102.7
72 5
93.1
115.9
83.8
1
2
3
4
5
6
7
8
9
10
11
12
13
113.3
109.4
X1
7
1
11
11
7
11
3
1
2
21
1
11
10
x2
x3
x4
26
6
15
8
60
29
56
31
52
55
71
31 44
5422
47
4034
66
6
9
17
22
18
4
23
9
68
52
20
47
33
22
6
26
12
12
y
x
a)
800
280
284
840
770
810
292
295
298
640
305
590
735
560
315
308
Pruebe la hipbtesisdeque
= O.
- 1.39
- 1.55
a)
1.89
I - 2.43 I
1.00
1.25
- 3.15
4.05
- 5.15
2.50
2.252.001.75
1.50
- 6.43
- 7.89
15-14
EJERCICIOS
641
-x.
-ahy
4.0
4.0
5.0
39.60 57.12
5.0
6.0
67.24 67.15
67.1177.87 80.11 84.67
6.5
6.5
7.0
7.1
6.75 7.3
a)
b)
c)
15-14 Considere los datos en el ejemplo 15.12. Pruebe la hiptesis de que dos modelos de
intervalos -00
< x x* y x* < x < 00. Muestre cmo las variables indicadoras
pueden utilizarse para ajustar tal modelo de regresibn lineal escalonada, suponiendo
que se conoceel punto x*.
15-16 Regresin lineal escalonada (11). Considere el modelo de regresi6n lineal escalonada descrito en el ejercicio 15- 15. Suponga que en el punto x* ocurre una disconls variables indicadoras pueden
tinuidad en la funci6n de regresin. Muestre cdmo a
y que debe estimarse. Desarrolle un planteamiento que podra usarse para ajustar el
modelo de regresin lineal escalonada.
642
modelo?
15-21 Los factores deinflacin de varianza para el modeloregresin
de
de cuatro variables
para los datosen la tabla 15-17 se muestran en la salida de computadora enla figura
15.15. Indican quela multicolinearidad es un problema en el modelo?
15-22 Emplee los datos de rendimiento delos equipos de la NationalFootball League en
elejercicio 15-5 paraconstruirmodelosderegresin
utilizandolas siguientes
tcnicas:
a) Todas las regresiones posibles.
b) Regresin escalonada.
c) Seleccin hacia adelante.
d) Eliminacin hacia a t r k
e ) Comente acerca de los diversos modelos obtenidos.
15-23 Use los datos de consumo de gasolina por milla en el ejercicio 15-6 para construir
regresin que involucre el total decuatro regresores y encuentre los diversos factores
de inflacin. Es la multicolinearidad un problema en estemodelo? Emplee la
regresin de arista paraestimar los coeficientes en este modelo. Compare el modelo
de aristacon los modelos obtenidosen el ejercicio 15-25 empleando los mtodos de
seleccin de variables.
Captulo 16
Estadstica no paramtrica
16.1 Introduccin
La mayor parte de las pruebas de hiptesis y de los procedimientos de intervalos
de confianza en los captulos previos se han basado en la suposicin de que
estamos trabajandocon muestras aleatorias depoblaciones normales. Por fortuna,
la, mayor parte de estos procedimientos son relativamente insensibles a ligeras
desviaciones respecto a la normalidad. En general, las pruebas de f y F y los
intervalos de confianza f tendrn niveles de significacin o niveles de confianza
reales que difieren de los niveles nominales o anunciados elegidos por el experimentador, aunque la diferencia entre los niveles real y anunciado suele ser sin
duda ms pequea cuando la poblacin de base no es demasiado diferente a la
normal. Por lo comn, hemos llamado a estos procedimientos, mtodos paramtricos debido a que sebasan en unafamilia paramtrica particular de distribuciones - e n este caso, la normal. Alternativamente, algunas veces afirmamos que
estos procedimientos no son libres de distribucin debido a que dependen de la
suposicin de normalidad.
En este captulo describimoslos procedimientos denominados no pararnfricos o libres de distribucin y no solemos hacer suposicionesrespecto a la
distribucin de la poblacin de base, aparte de que es continua. Estos procedimientos tienen nivel de significacin real o nivel de confianza de 100( 1 - a) por
ciento en muchos tipos diferentes de distribuciones.Estos procedimientos tienen
un atractivo considerable. Una de sus ventajas es que los datos no necesitan ser
cuantitativos, pero podran ser datos categricos (tales comos o no, defectuoso
o no defectuoso, etc.) o de rango. Otra ventaja es que los procedimientos no
categricos suelen ser m u y rpidos y se realizan con facilidad.
Los procedimientos descritos en este capitulo son competidores de losprocedimientos paramtricos de f y F descritos antes. En consecuencia, es importante
comparar el rendimiento tanto de los mtodos paramtricos comode los no
644
16-2 PRUEBA
DE SIGNO
645
Observacidn
Resistencia
corte
Diferencias
al
i
1678.1
1
2
3
4
2357.90
2165.20
1779.80
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
x,
x, - 2000
2158.70
5
2316.00
2061.30
2207.50
1708.30
1784.70
2575.1 O
+ 158.70
+ 321.85
2256.70
2399.55
2336.75
1765.30
2053.50
2414.40
2200.50
2654.20
1753.70
6.00
+ 31
61.30
+ 207.50
- 291.70
- 215.30
+ 575.00
357.90
+ 256.70
165.20
+ 399.55
- 220.20
+ 336.75
- 234.70
+ 53.50
41 4.40
+ 200.50
+ 654.20
- 246.30
Signo
+
+
+
+
+
+
+
+
+
-
+
-
+
+
+
+
-
646
Las ltimas dos columnas de la tabla 16.1 muestran las diferencias (X,
- 2000)
para i = 1, 2, . . . , 20 y los signos correspondientes. Note que RS = 14 y R- =
6. En consecuencia R = mn(R+, R-) = mn (14,6) = 6. De la tabla X del apndice
con R = 20 encontramos que el valor crtico paraa = .O5 es Rb, = 5. Por tanto,
puesto que R = 6 no es menor o igual que el valor crtico R>5 = 5, no podemos
rechazar la hiptesisnula de que la resistenciamedia al corte sea de 2000 psi.
es una variable aleatoria binomial, podramos
Notamos que en virtud de Rque
probar la hiptesis de inter& calculando directamente
un valor de P a partir de la
distribucin binomial. Cuando Ho: i; = 2000 es cierta, R tiene una distribucin
binomial con parmetros n = 20 y p = .5. Demodo que la probabilidad de
observar seis o menos signos negativos enuna muestra de 20 observaciones es
h
P(R
6)
( 2:j(.5)(.5)20-r
r=O
= .O58
647
Auto
1
2
3
4
5
6
7
8
9
10
11
12
17.6
19.4
19.5
17.1
15.3
15.9
16.3
18.4
17.3
19.1
17.8
18.2
Dispositivo de medicidn
2
Diferencia, Dj
.8
- .6
1.3
.7
- .7
16.8
20.0
18.2
16.4
16.0
15.4
16.5
18.0
16.4
20.1
16.7
17.9
.5
- .2
.4
.9
- .1
1.1
3
Signo
+
+
+
+
+
+
+
+
-
R - .5n
.S&
(1 6-2)
Se rechazara la alternativa de dos lados si lZ,I > Zd2, y las regiones criticas de
la alternativade un lado sepodran elegir para reflejar el sentidode la alternativa
(si la alternativa es H I :i; > r((0, se rechaza H , si Z, > Z,, por ejemplo).
16-2.2 Prueba de signo para muestras pares
La prueba del signo puede aplicarse tambin a observaciones en pares extradas
de poblacionescontinuas.Sea
(Xlj,
j = 1, 2, . . . , n una coleccinde
observaciones en pares de dos poblaciones continuas,y sean
D,=Xl,-Xz,
j = 1 , 2 ,..., n
648
Segn H o : 1.1 = 2
Segn H,, :
- 43
Segn / f , : p =
Segn \I, :
2= 3
( bi
Figura 16.1 Clculo de fl en la prueba del signo. a) Distribuciones normales, b) distribuciones exponenciales.
649
P ( Z > -1)
p = P ( X > 2)
@ ( - l )= .S413
1-
2 (~)(.1587)'(.8413)'".'
.2944
r=O
P ( X > 2) =
S,
1
-e
4.33
1
" X
4.33
"
dx
c.33 =
.6301
,8 = 1 -
.x = o
3794
De tal modo, el error p para la prueba del signo no slo depende del valor
alternativo de i; sino del rea a la derecha del valor especificado en la hiptesis
nula bajo la distribucin de probabilidad de lapoblacin. Esta rea es altamente
dependiente de la forma de ladistribucidn de probabilidad particular.
16-2.4 Comparacin de la prueba del signo y la prueba t
Si la poblaci6n de base es normal, entonces ya sea laprueba del signoo la prueba
podran utilizarse para probar Ho: =
Se sabe quela prueba t tiene el valor
z.
650
Estamos interesados en probarN,:y = p , contra las alternativas usuales. Sup6ngase queXI,X,, , . . ,X, es una muestra aleatoria de una distribucin continuay
simtrica con media (y mediana) p . Se calculan a
ls diferencias X, y,, i = 1,2,
. . . , N. Se clasifican las diferencias absolutas IXi -pol, i = 1,2, . . . , n en orden
ascendente, y luego se asignan a los rangos los signos de sus diferencias correspondientes. Sea R+ la suma de los rangos positivos y R- el valor absoluto de la
suma delos rangos negativos, y sean R = mn (RC,R-). La tabla XI del aptndice
contiene los valores crticos de R, por ejemplo R", Si la hip6tesis alternativa es
H,: y it y,, entonces si R < R:,se rechaza la hiptesis nula H,: p = p,.
En las pruebas de un lado, si la alternativa es HI:y > y, se rechaza H,: ,u =
y, si R- < Fe;
y si la alternativa esH,: y < y, se rechaza H,: p = posi Rf < R,.
Elniveldesignificacibnpara
las pruebas de un lado es la mitad del nivel
anunciado en la tabla XI del apdndice.
Ejemplo 16.3 Para ilustrar la prueba de Wilcoxon del rango con signo, considtrense los datos de resistencia al corte del propulsante presentados en la tabla
16.l . Los rangos con signo se muestran a continuacin:
.70
16-3
657
Xi 2000
ObseNacibn
Diferencia
16
4
1
11
18
5
7
13
15
20
10
6
3
2
14
9
12
17
8
19
+l
+ 61.30
+ 158.70
+ 165.20
+ 200.50
+ 207.50
5.20
- 21
- 220.20
- 234.70
+ 256.70
- 291.70
6.00
4.40
+ 53.50
+ 31
- 321.85
+ 336.75
+ 357.90
+ 399.55
+ 41
+ 575.00
+ 654.20
+2
+3
+4
+5
+6
-7
-8
-9
-10
+11
- 12
+13
-14
+15
+ 16
+17
+18
+ 19
+ 20
+ 1)
4
652
y varianza
n(n
DR
+ l ) ( 2 n + 1)
24
En consecuencia, una prueba de H,: p = po puede basarse en la estadstica
z,
R =
in(n
+ 1)/4
~ ( I I
+ 1)(2n f
(16-3)
1)/24
7
12
8
6
2
4
5
1
9
10
11
3
Diferencia
- .2
.3
.4
.5
- .6
.7
- .7
.8
.9
-1.0
1.I
1.3
-1
2
3
4
-5
6.5
- 6.5
8
9
-10
11
12
16-3
SIGNO
653
exceder la unidad.
Aunque estos son resultados de muestras grandes, por lo general concluimos que
la prueba de Wilcoxon del rango con signo nunca ser peor que la prueba t y en
muchos casos en los que la poblacin no es normal tal vez resulte superior.
654
R,
nl(nl
+ n 2 + 1) - R ,
(16-4)
,u,
655
Aleaci6n 1
3254 psi
3229
3225
321 7
3241
3238 Psi
31 95
3246
31 90
3204
LOS
Aleaci6n 2
3261 psi
3187
3209
3212
3258
3248 psi
3215
3226
3240
3234
1
1
1
2
2
2
1
1
2
1
2
1
2
1
1
19
20
2
1
2
2
31 90
31 95
3204
3209
3212
321 5
321 7
3225
3226
3229
3234
3238
3240
3241
3246
3248
3254
3258
3261
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
R,
= n,(n,
+ n , + 1) - R ,
lO(10
+ 10 + 1) - 99 = 111
656
16-4.2
y varianza
(16-5)
yji = p
+ T, + E . .
i = 1 , 2 , ..., a
(16-6)
En este modelo los terminos de error cli se supone que se distribuyen normal e
independientemente con media cero y varianza
Q *.La suposicidn de normalidad
conduce directamente a la prueba F descrita en el captulo 12. La prueba Kruskal-Wallis es un alternativa no paramdtrica para la prueba F; s610 requiere que
las &., tengan la misma distribuci6n continua para todos los
tratamientos i = 1,2,
...,a.
las
es cierta, la N observaciones provienen de la misma distribucidn y todas
posibles asignaciones de losN rangos para las a muestras son igualmente probables, esperaramos entonces que los rangos1,2, . . . ,N se mezclen a lo largo de
las a muestras. Sin embargo, si la hip6tesis nula Ho es falsa, entonces algunas
muestras constarn de
a observaciones quetendrhn en forma predominante
rangos
pequeiios, en tanto que otras muestras constarn de observaciones con rangos
predominantemente grandes. SeaR, el rango deobservacidn y,. y seaRi y
que
denoten el total y el promedio de los ni rangos en el tratamiento iBsimo. Cuando
la hip6tesis nula es cierta,
N+l
E(R,,) = 2
e.
E(R,.) =
nr
-
N + l
E(R,,)
R.
(16-7)
Una f6rmula de cmputo alternaes
(16-8)
CAP~TULO
16 ESTAOkTlCA NO PARAMETRICA
658
ni> 6
parai= 1,2,3
a>3
n,z5
p a r a i = 1 , 2 , ..., a
(16-10)
el
de igualaciones
N6tese queS es ~610la varianza de los rangos. Cuandonmero
es moderado, habr6 una pequea diferencia entre las ecuaciones 16-8 y 16-9, y
puede utilizarse la forma simple(ecuaci6n 16-8).
Ejemplo 16.6 En Design and Analysis of Experiments, 2a. edici6n (John Wiley
& Sons, 1984), D. C . Montgomery presenta datos de un experimento en el cual
TABLA 16.3
659
Porcentaje d e algod6n
15
YI~
1' 1
7
7
15
11
9
2.0
2.0
12.5
7.0
4.0
17,.
27.5
y21
R2i
12
9.5
14.0
9.5
16.5
16.5
17
12
18
18
~ 3 j
14
18
18
19
19
66.0
35
30
25
R3i
YA,
R,
y51
11.0
16.5
16.5
20.5
20.5
19
25
22
19
23
20.5
25.0
7
10
11
15
11
85.0
23.0
20.5
24.0
113.0
'5,
2.0
5.0
7.0
12.5
7.0
33.5
53.03
y la estadstica de prueba es
53 .O3
[5245.0 -
19.25
Transformacin de rango
31 procedimiento que se emple6 en la secci6n anterior de reemplazar las obserraciones por sus rangos se llama rransfurmacin de rangos. Es una t6cnica muy
660
CAPiTULO 16
ESTADiSTlCA NO PARAMCTRICA
16-6 Resumen
Este captulo presentlo mktodos no paramtricos o libres de distribucin. Estos
procedimientos son alternativas para las pruebas parametricas usuales f y F
cuando no se satisface la suposicin de normalidad en la poblacin de base. La
prueba del signopuede emplearse para probar hiptesis acerca de la mediana de
una distribucidn continua.Tambin puede aplicarse aobservaciones en pares. Es
posible utilizar la prueba Wilcoxon del rango con signo para probar hiptesis
relativasalamedadeuna
distribucibn continuasimtrica. Adembs, puede
aplicarse a observaciones en pares. La prueba del rango con signo es una buena
alternativa para la prueba
t . El problema de laprueba de hiptesis de
dos muestras
respecto alas medias de distribuciones
simktricas continuas se plantea empleando
la prueba Wilcoxon de la suma de rangos. Este procedimiento se compara en
forma muy favorable con la prueba t de dos muestras. La prueba Kruskal-Wallis
es unaalternativa til para la pruebaF e n el anlisis devarianza.
16-7 EJERCICIOS
661
16-7 Ejercicios
16-1 Setomarondiez
El contenido medio de titanio debe ser 8.5 por ciento. Emplee la prueba del signo
para investigar estahipdtesis.
en un probadordedureza
Rockwell. Se seleccionan ocho cupones de lingotes de prueba de una aleacin
base de niquel, y cada cupn se prueba dos veces, una vez con cada punta. Las
lecturas de dureza Rockwell de la escala C se muestran a continuacin. Emplee
la prueba del signo para determinar si las dos puntas producen lecturas de dureza
equivalentes o no.
662
Cup611
Tipo 1
Tipo 2
63
60
52
58
51
56
60
55
59
58
57
53
59
54
52
61
16-7. Considere la prueba deWilcoxon del rango consigno, y suponga quen = 5. Suponga
tambiCn que Ho: p = sea cierta.
U)
Cuntas secuenciasdiferentes de rangos con signo
son posibles? Enumere estas
secuencias.
b) Cuntos valores diferentes deR+ hay? Encuentre la probabilidad asociada con
cada valor deR+.
c) Suponga que definimos la regin crtica de la prueba como
RL tal como la
rechazaramos si R+ > R', R', = 13. Cual es el nivel Q aproximado de esta
prueba?
d) Puede usted ver, a partir de este ejercicio, c6mo se desarrollaron los valores
crticos para la prueba de Wilcoxon de rango con signo? Explique.
16-8 Considere los datos en el ejercicio 16-1, y suponga que la distribucin de pH es
simktrica y continua. Emplee la pruebaWilcoxon del rango con signo para probar la
hiptesis Ho: p = 7 contra HI:p # 7.
16-7 EJERCICIOS
663
16-9 Considere los datosen el ejercicio 16-2. Suponga quela distribucibn del contenido
de titanio es simktrica
y continua. Emplee la prueba
de Wilcoxon del rango con signo
para probar la hip6tesisHo: p = 8.5 contra H I :p # 8.5.
16-10 Considere los datos en el ejercicio 16-2. Emplee la aproximaci6n
de muestra grande
p = 8.5 contra
en la prueba Wilcoxon del rango con signo para probar laHo:
hipdtesis
HI: p # 8.5. Suponga que la distribuci6n del contenido de titanio es continua y
simktrica.
16-11 En la aproximaci6n de muestra grande parala prueba del rango con signo, obtenga
la mediay la desviaci6nesthdar de la estadstica de prueba utilizada en el procedimiento.
16-12 Considere los datos de la prueba de dureza Rockwell en el ejercicio 16-5. Suponga
que ambas distribuciones son continuas
y emplee la prueba de Wilcoxon del rango
con signo para probar que la diferencia media en las lecturas de dureza entre las dos
puntas es de cero.
16-13 Un ingeniero electricista debe disear un circuito para dar la msxima corriente a un
81 ha desarrollado dentro de
tubo de imagen para alcanzar la brillantez suficiente.
los protolas restricciones de diseo permisibles, dos circuitos candidatos y prueba
Los candidatos resultantes (en microamperes) se muestran
tipos de cada uno de ellos.
en seguida:
\
16-15 El fabricante de baeras esta interesado en probar dos diferentes elementos calefactorespara su producto. Sera preferible
el elemento que produzca la maxima ganancia
de calor al cabo de15 minutos. Obtiene 10 muestras de cada unidadde calefacci6n
y las prueba una por una. La ganancia de calor despues de 15 minutos en ( O F ) se
-""
~"
-.
664
muestra a continuacin.Hay
superior a la otra?
alguna raznparasospechar
31,
Unidad
35,
32, 233, 31,
30,
34,
26,
24,
32,
29,
38,
35, 30 37,
33,
38
16-16 En Designand Analysis of Experiments, 2a. edicin (JohnWiley & Sons, 1984), D.
C. Montgomery presenta los resultados de un experimento para comparar cuatro
mezclado
Resistencia
1
2
3
4
a tensibn
la
3129
3200
2800
2600
3000
3000
2900
2700
(lb /
2865
2975
2985
2600
pig.')
2890
3150
3050
2765
16-17 Un artculo en el
Mbtodo de humidificaci6n
Resistencia
a
553
553
492
1
2
3
550
599
530
568
579
528
541
545
51O
537
540
571
16-18 En Statistics for Research (John Wiley & Sons, 1983), S. Dowdy y S. Wearden
C
D
de contragolpe
42
28
57 48
29
17
50
45
40
24 43
4461
39
32
41
22
34
54
30
Captulo 17
Control de calidad estadstico
e ingeniera de confiabilidad
666
667
668
1.
2.
3.
4.
5.
6.
La teora bsica del diagrama decontrol fue desarrollada por el doctor Walter A.
Shewhart en la dcada de los veinte. Para entender cmo trabaja un diagrama de
control, debemos entender primero la teora de la variacin de Shewhart. Shewhart formul la teora de que todos los procesos, incluso los buenos, se caracterizan por una cierta cantidad de variacin si se miden con un instrumento de
suficiente resolucin. Cuando esta variabilidad se limita slo a una variacin
aleatoria oprobabilistica, se afirma que el proceso estaren un estado decontrol
estadzstico. Sin embargo, puede existir otra situacin en la cual la variabilidad
del proceso tambin sea afectada por alguna causa asignable, tal como un mal
ajuste de una mquina, un error del operador,materia prima inadecuada, componentes de la mquinadesgastados,etc. Estas causas devariacin asignables
Algunas vecesse emplea causacomn en lugar de causa aleatoria o casualidad, y causaespecrol
se utiliza en lugar de causa asignable.
669
suelen tenerun efecto adversoen la calidad del producto, por lo que esimportante
tener algunatcnica sistemhtica para detectar seriasdesviaciones de un estado de
control estadstico tan rhpido como sea posible despues de que ocurran. Los
diagramas de controlse emplean principalmente para este prop6sito.
La fuerzadel diagrama decontrol radica en su capacidad para detectar causas
asignables. Es labor delos individuos que emplean el diagramadecontrol
identificar la causa fundamental que origin6 la condici6n fuera de control,
desarrollar e implantar una acci6n correctiva apropiada y despus, asegurar que
la causa asignable ha sido eliminada del proceso. Hay tres puntos que recordar:
l . Un estado decontrol estadstico noes un estado neutral para la mayor parte
de los procesos.
2. El empleo cuidadoso de los diagramas de control resultar&en la eliminaci6n de causas asignables, produciendo un proceso bajo control y reduciendo la variabilidad del proceso.
3. El diagramadecontrol
es ineficaz sin el sistema para desarrollar e
implantar acciones correctivas que
ataquen la causa raz de losproblemas.
Para lograr esto suele ser necesario la participaci6n de la administracibn
y la ingeniera.
670
-m
V
2
m
P)
V
Lineacentral
S
u1
I
-
&
*
O
I
1
l
2
1
4
10
11
1
12
'
Nmero
de
13 la muestra
tendencia o algn otro patr6n sistemhtico puede indicar que cierta accidn es
necesaria, por lo comn para evitar un problema mhs serio. Las muestras deben
lo mhs homogknea posible,
seleccionarse de tal manera que cada una de ellas sea
y para que al mismo tiempo maximice la oportunidad de variaci6n debida a una
causa asignable que este presente. Esto suele llamarse concepto del subgrupo
racional. El orden de la produccidn y la fuente (si existe mhs de una), son las
bases que se emplean comnmentepara obtener subgrupos racionales.
La capacidad de interpretar en forma precisa los diagramas de control suele
adquirirse con la experiencia. Es necesario que el usuario este familiarizado por
completo tanto con los fundamentos estadsticos de los diagramas de control
como con la naturaleza del propioproceso de producci6n.
17-3.2 Diagramas de control para mediciones
671
De tal modo, podemos tomar como la lnea central del diagrama de control 2.
Es posible que estimemosa y a sea de las desviaciones estndar o de losrangos
de las k muestras. Puesto que se emplea con mayor frecuencia en la prhctica,
confinamos nuestra exposicin al metodo del rango. El tamaflo de la muestra es
relativamente pequeflo, por lo que se pierde poco en eficienciaal estimar oapartir
de los rangos de la muestra. Se necesita la relacin entre el rango, R, de una
muestrade una poblacin normal con parametros conocidosy la desviacin
estandar de la poblacin. Puesto que R es una variable aleatoria, la cantidad W =
R/o, denominada rango relativo, tambiCn es una variable aleatoria. Los parhmetros dela distribucin de W se han determinado para cualquier tamaflo de muestra
n. La media de la distribucin de W se llama d2,y la tabla de d2para diversas n
se proporciona en la tabla XJlI del apendice. Sea R, el rango dela muestra iksima,
y sea
(17-2)
(17-3)
?n consecuencia, podemos emplear nuestros lmites superiores e inferiores para
672
el diagrama
LCS
3 = x- + R
d
2 f i
LCI
3 = x= - R
( 17-4)
d2fi
LCS
=
=
x + A2R
x - A2R
(17-5)
WU
uwu
SO
ESTADkTlCO
DEL
17-3 CONTROL
673
D,R
LC1
D,R
(17-7)
Nmero de
la muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
X1
x2
x3
x4
x5
33
35
35
30
33
38
30
29
28
39
28
31
27
33
35
33
35
32
25
35
29
33
37
31
34
37
31
39
34
33
30
35
32
33
37
33
34
33
27
35
31
.31
33
33
35
39
32
38
35
32
28
35
34
35
32
27
34
30
34
36
32
37
34
34
33
40
34
39
36
34
32
35
35
37
35
31
30
30
27
33
33
31.6
31
33.0
36
35.0
33
32.2
34
33.8
38
38.4
31
31.6
39
36.8
43 15 35.0
32
34.0
31
29.8
34
34.0
37
33.0
36
34.8
35.6
39
30.8
30
32
33.0
33
31.6
28
28.2
30
33.8
4
6
4
4
2
3
4
10
6
4
4
10
4
7
6
5
3
9
6
33.3 = 5.65
40
421
1 2 3 4 5 6 7 8 9 1011121314151617181920
Nmero de la muestra
DiagramaX
16
Ntimero de la muestra
Diagrama R
Figura 17.2
x,
9 _+ A , R
33.3
(.577)(5.65)
33.3
_+
LCS
LCI
36.56
30.04
D,R
(2.115)(5.65)
11.95
3.26
675
Estimaci6n de_lmites
DiagramaX
@ = noutilizadoen
18
16
el c&lculodeloslmitesdecontrol
14
1
1 2 3 4 5 6 7 8 9 1011
121.314151617181920
1 1 1 1 1 1 1 1 1
Nmerodelamuestra
I
Estimaci6n de lmites
Diagrama R
Figura 17.3
Diagramas de control
LCZ
D,R
(0)(5.65)
LC1
x- + A , R
x.
+ (.577)(4.8)
35.96
- A 2 R = 33.19 - (.557)(4.8)
30.42
33.19
676
CAPTULO 17 CONTROLDECALIDADESTADSTICOEINGENIERIADECONFIABILIDAD
y para el diagrama R,
LCS = D,R = (2.115)(4.8) = 10.15
D,R = (0)(4.8) = O
'Los diagramas de controlrevisados se muestran en la figura 17.3. Ndtese que
hemos tratado las primeras 20 muestras preliminares como datos de estimacin
para establecercon ellos limites decontrol. Estos lmites pueden emplearse ahora
para valorar el control estadstico deproduccidn
la
futura. Conforme se disponga
cadanueva muestra, los valores de X y R deben calcularse y graficarseen
diagramas de control.Tal vez sea deseable revisar los lmites en formar periddica,
incluso si el proceso permanece estable. Los lmites siempre deben revisarse
cuando seefecten mejoramientos del proceso.
=
Estimaci6n de la capacidad del proceso Suele ser necesario obtener informaci6n acerca de la capacidad del proceso; esto es, el desempefo del proceso
cuando opera bajo control. Dos herramientas grficas, el diagrama de tolerancia
(o diagrama dehileras) y el histograma son tilesenla
evaluacin dela
45 I
an
LES = 40
Dimensi6n
nominal = 30
25
1 5 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 " 1
5
10
15
20
Numero de la muestra
Figura 17.4 Diagrama de tolerancia de las aberturas de labe.
677
20 -
15
.-m
c
J 10o
2
5-
LES
Dimensi6n nominal
678
RCP 1 1
LEI
LES
RCP = 1
Unidades no
concordantes
no
LEI
Unidades
concordantes,
LES
RCP< 1
no
Unidades
concordantes
co
(C)
Figura 17.6 Cada del proceso y raz6n de capacidad del proceso (RCP)
el proceso es capazde cumplir las especificaciones, pero que se est desarrollando fuera del centro.
Otra manera de expresar lacapacidad del proceso es en trminos de razn de
Capacidad del proceso RCP, definida como
RCP
LES LEI
60
(1 7-8)
679
mayor parte de las unidades producidas. Para la abertura del Alabe, podramos
estimar (T como
4.8
d,
2.326
,-="="
2.06
En consecuencia la RCP es
RCP
LES -LEI
60
40 - 20
-~
-
6(2.06)
=
1.62
LaRCPtiene
una interpretaci6n natural; (l/RCP)lOO esexactamente el
porcentaje de la banda de tolerancia empleada por el
proceso. As, el proceso de
la abertura delAlabe emplea aproximadamente (1/1.62)100 = 61.7 por ciento de
la banda de tolerancia.
La figura 17.6a muestra un proceso en el cual RCP
la excede launidad. Puesto
que los lmites de tolerancianaturales se encuentran dentro de las especificaciones, se producirhn muy pocas unidades defectuosas o no concordantes. Si RCP
= 1, como se muestraen la figura 17.6b, resultan miis unidades no concordantes.
En efecto, en un proceso distribuido normalmente, si RCP = 1 la fracci6n no
concordante es .27 por ciento, o 2700 partes por mill6n. Por ltimo, cuando la
RCP es menos que la unidad, como en la figura17.6c, la producci6n del proceso
es muy sensible y seproducirhn un gran nmero de unidades no concordantes.
La definici6n dela RCP dada en la ecuaci6n 17-8 supone de manera implcita
que el proceso esta centrado
en la dimensi6n nominal. Si el proceso se desarrolla
fuera del centro, su capacidad real sera menor que la indicada por la RCP. Es
conveniente considerar a la RCP como una medida de la capacidad potencial;
esto es, capacidad con un proceso centrado. Si el proceso no esta centrado,
entonce,s una medida de la capacidad real esta dada por
(17-9)
En efecto, RCP, es la raz6n de capacidad de proceso de un lado que se calcula
respecto al lmite de especificacibn mas cercano a l a media del proceso. Para el
proceso de la abertura del Alabe, vemos que
LES - X
x - LEI
30
30
"
RCPk
mn
680
mn
1.10
40 - 33.19
3(2.06)
1.10,
33.19 - 20
3(2.06)
2.13
681
D
(17-10)
=,
Dl
(17-;2)
LCI
3$
-a
(17-13)
682
Muestra
2
3
4
-5
6
7
8
9
10
Nurn.
defectos
Muestra
de
Nm. de defectos
44
48
32
50
29
31
46
52
44
38
36
52
35
41
42
30
46
38
26
30
11
12
13
14
15
16
17
18
19
20
.40
+3
.40
(.40)( .60)
=
.55
.25
El diagrama de control
se muestra en la figura 17.7. Todas las muestras estn bajo
control. Si no fuera as,buscaramos las causas de variacin asignables y revisaramos los lmites en la debida forma.
Aunque este proceso exhibecontrolestadstico, su capacidad ( = .40) es
muy pobre. Debemos considerar los pasos adecuados para investigar el proceso
y determinar por qu se est produciendo un nmero tan grande de unidades
defectuosas. Las unidades defectuosas deben analizarse para determinar los tipos
<P
U.
Figura 17.7
Nlimero de la muestra
El diagrama p para un sustrato cermico
683
.1601
c=
1
-
k
cc;
r=l
(17-14)
684
Y
LCS
LC/
cs 3 6
c - 3fi
(17-15)
defectos
defectos
Muestra
Muestra
de
de
Num.
Nm.
1
2
3
4
5
6
7
8
6
4
8
10
9
12
16
2
3
10
9
10
11
12
13
14
15
16
17
18
19
20
9
15
8
10
8
2
7
1
7
13
2
1 2 3 4 5 6 7 8 g1011121314151617181920
Numero de la muestra
Diagrama C
Figura 17.8 El diagrama c para defectos en muestras de cinco tarjetas
de circuito impreso.
685
Del diagrama decontrol de la figura 17.8, vemos que el proceso esta bajo control.
Sin embargo, ocho defectos por grupo de cinco tarjetas de circuito son muchos
(alrededor de 8/5 = 1.6 defectodtarjeta), y el proceso necesita mejoramiento. Es
necesario efectuar una investigacin respecto a los tipos especficos de defectos
encontrados en la tarjeta de circuito impreso. Esto casi siempre indicara caminos
potenciales para el mejoramiento del proceso.
El diagrama u (defectos por unidad) En algunos procesos puede ser preferible
trabajar con el nmero dedefectos por unidad en lugar del nmero totai de
defectos. De tal modo, si la muestra consta de n unidades y hay c defectos totales
en la muestra, entonces
(17-16)
y los limites de control estn dados por
LCS
u+
LC/
u-
3E
3c
(17-17)
686
Defecto
Numero
Tamano
de
de
n
Muestra
muestra
defectos, c
por unidad
6
4
0.8
1.6
2.0
5
5
5
5
5
5
2.4
1 1.2
2
3
4
5
6
16
3.2
0.4
0.6
2
3
10
9
15
5
5
5
2.0
1 .a
12
5
5
7
8
10
11
12
13
14
15
16
17
18
19
20
10
5
5
5
5
1.a
3.0
1.6
10
2.0
1.6
0.4
1.4
0.2
1.4
2.6
2
7
1
7
13
5
5
5
5
5
3E
1.6
+3
3.3
607
4
LCS = 3.3
2 3 4
5 6 7 8 9 1011121314151617181920
Numero de la muestra
u paradefectosporunidadentarjetas
de circuito
688
17-3PROCESO
CONTROL DEL
ESTADSTICO
889
Frente
Parte trasera
690
691
Liderazgo gerencial.
Trabajo en equipo.
Educaci6n de los empleados a todos los niveles.
nfasis en el mejoramiento continuo.
Un mecanismo para reconocer elBxito.
692
Fraccibn
Proceso de
inspecci6n
Lotes salientes
defectuosa
=p,
< Po
Lotesaceptados con
fracci6n defectuosa = po
la fraccidn
LCSP
O
O
Calidadentrante(fracci6ndefectuosa)
693
ESTADSTICAS
control directo sobre la calidad del proceso. Esto es as, sobre todo, cuando se
muestrean bienes de los proveedores y los lotes rechazados no se regresan.Es
evidente que siempre se lograra algn control indirecto a travds de la comunicaci6n con el fabricante. El tnfasis moderno en cuanto al mejoramiento de
la calidad se enfoca hacia el CPE y el diseAo de experimentos, y es probable
que el muestreo, la inspecci6n y los metodos de prueba se empleen menos en
el futuro.Un sistema eficaz para el control de proceso y mejoramiento puede
reducir en forma considerable, y en algunos casos eliminar la necesidad del
muestreo de aceptaci6n.
En esta seccibn brindamosun breve panorama de algunos procedimientos de
aceptaci6n de ampliaaplicaci6n. Para mayores detalles, refikrase a Montgomery
(1985, captulos 10, 1 I , 12).
Consideraremos un procedimiento conocido comoun plan de muestreonico.
El procedimiento consisteen extraer una muestra aleatoria detamafio n de un lote
compuesto de N artculos. Sea d el nmero de artculos defectuosos en esta
d es menor que o igual aciertonmerode
muestraaleatoria.Entoncessi
aceptacibn, c, se aceptael lote. Puesto que N es fijo, los pariimetros n y c
especifican por completo el
plan de muestreo.El procedimiento recibe el nombre
de plan de muestreo nico debido a que se toma una decisi6n con base en los
resultados deuna muestra. Si des mayor quec, rechazamos el lote y existen
varias
posibilidades. Podemos regresar un lote rechazado al fabricante,
en cuyo caso se
dice que el plan de muestreo serii no rectificable: la calidad promedio que entra
alprocesode producci6n es lamismaquelacalidadpromedioquedeja
el
fabricante.
Por otra parte,podemos seleccionar (inspeccionar el 100 por ciento) los lotes
rechazados, ya sea reemplazando todos los artculos defectuosos por buenos, o
simplemente desecharlos. Esta alternativa se llama inspecci6n rectificable: la
calidad promedio que entra al proceso de producci6n es superior a la calidad
promedio que deja elfabricante. De tal modo, por inspecci6n rectificable pensamos en la calidadsaliente promedio del procesode inspecci6n. La calidad
promedio de salida sera alta tanto cuando la
calidad de entrega sea alta (y se
rechacen pocos lotes de altacalidad) como cuando lacalidad de entrada seabaja
(y se rechacen y seleccionen muchos lotes de baja calidad). Puede demostrarse
que la calidad promedio de salida tiene
un lmite inferior, llamado lmite de
calidad promedio de salida (LCPS). As, sin importar lo mala que se vuelva la
calidad entrante,jacalidad promedio de salida nunca sera
peor que el LCPS. Este
proceso se ilustra en las figuras 17.13 y 17.14.
Cualquier plan de muestreo de aceptaci6n puede describirse en tdrminos de
su curva caracterstica inicial. Una curva caracterstica de operaci6n comn para
un plan de muestreo nico se muestra en la figura17.15. El nivel de calidad que
se considera bueno y el que deseamos aceptar la mayor parte de las veces se
llama nivel de calidadaceptable (NCA). El nivel que se considera malo y que
debe rechazarse casi siempre, se denomina porcentaj defectuoso tolerable del
7 8
. c
694
1.o
PDTUIOO
Fraccidn defectuosa del lote
(m.
m,
695
Ejemplo 17.6 Considere un plan de muestreo nico para atributos. Sise propone un lote de calidad pl, la probabilidad de aceptaci6n debe ser 1 a. Si se
propone un lote de calidad p z , la probabilidad de aceptaci6n debe ser p. De tal
modo,
1-a =
( S ) p j ( l -PI)""
i=O
(;)p:(l
- p2)"
J"0
TCcnicamente,estamosconsiderandouna"corriente"de
lotes. Asi, lapoblacibnqueestamos
muestreando es infinita,y ladistribucibn binomiales apropiada.Si estuvikramos comprandos610 lotes
los lotes individualeses importante, entonces debe emplearse
la distribucihn
aislados, o si la calidad de
hipergeometrica.
696
697
0.0024
(.
1)p
(y
y n es aproximadamente
(17-18)
698
1.9
9.488
n=-+-.-z4fj
2
.I
4
observaciones.
Obsrvese que hay una diferencia fundamental entrelos lmites de confianza
y los lmites de tolerancia. Los primeros se utilizan para estimar
un parmetro de
una poblacin, en tanto quelos lmites de tolerancia se emplean para indicar los
lmites entre los cuales podemos encontrar
una proporcin de una poblacin.
Cuando n tiende a infinito, la longitud deun intervalo de confianza se aproxima
a cero, en tanto que
los limites de tolerancia tienden a los valores correspondientes
para la poblacin.As, en la tablaXI del aptndice cuando n se vuelvem8s grande
para P = .90, por ejemplo, K se aproxima a 1.645.
17-6 Ingenieradeconfiabilidad
Uno de los esfuerzos desafiantes de las pasadas tres dcadas ha sidoel diseAo y
desarrollodesistemasa
gran escalapara la exploracinespacial, la nueva
generacin de aeronaves comerciales y militares,y los productos electromecnicoscomplejostalescomo
las copiadoras de oficinaylascomputadoras.
El
desempeiiodeestossistemas,y
las consecuencias de sus fallas, es de vital
importancia. Por ejemplo,la comunidad militar ha puesto histricamente
un gran
nfasis en la confiabilidad de los equipos. Este nfasis surge en gran parte por
razones crecientes del costo de mantenimiento respecto a los costos de adquisicin y de implicaciones estratgicas y tcticas de la falla de los sistemas. En el
rea de la manufactura de productos para el consumidor, la alta confiabilidad se
ha convertido en una expectativa igual a la conformidad con otras importantes
caractersticas de calidad.
La ingeniera de confiabilidad comprende diversas actividades, una de las
cuales es el modelado de la confiabilidad. En esencia, la probabilidad de supervivencia del sistema se expresa como una funcin del subsistema deconfiabilidad
de los componentes (probabilidades de supervivencia). Estos modelos suelen depender del tiempo, pero hay algunas
situacionesdonde ste no es el caso. Una segunda
actividad importante es la de la prueba de vida y la estimacin de laconfiabilidad.
17-6.1
Definicionesbsicas de confiabilidad
699
O
Figura 17.17 Distribucibn de fallas compuesta.
p ( 0 ) + I Z g ( r ) dr
(17-19)
=o
casootro en
R(t )
1 - F( t )
/(.Y)
ds
(17-21 )
'1
700
( I 7-23)
tl}
lm
R(t)- R(t
R(t)
Al -0
+ 11)1
lm
R(r
Jf -0
+ A[)
A2
Al
-
R(r)
.__
R(f)
( 1 7-24)
- Fallas
en edad
4
-
Fallas aleatorias
temprana
Y
fallas
aleatorias
Figura 17.18
-Fallaspordesgaste+
Y
fallas aleatorias
701
donde
H(t)
j ' h ( x ) dx.
o
por lo que
(dh(x) dx = -log, R ( t ) + log, R ( 0 )
= ,l%,R(')
R(t)
E [ T ]=
Irnl
o
- f ( t ) dl
E [ T ] = I m R ( t ) dz
( 17-26)
El modelado de sistemasmhs complejos supone que s610 las fallas decomponentes aleatorias necesitan considerarse. Esto es equivalente a establecer que el
702
=o
caso
otro
en
de modo que
es una constante. Cuandose han eliminado todas las fallas de etapa temprana
por
el quemado inicial y el tiempo para la ocurrencia de fallaspor desgaste es muy
grande (como con las partes electrnicas), entonces esta suposicienes razonable.
La distribucidn normal se emplea con mayor generalidad para modelar fallas
por desgaste o fallas por esfuerzo (donde la variable aleatoria es el nivel de
esfuerzo en vez del tiempo). En situaciones donde la mayor parte de las fallas
se
deben al desgaste, la distribucin normal puede ser muy apropiada.
Se haencontrado que la distribuci6n lognormal es aplicable en la descripcin
del tiempo de falla en algunos tipos de componentes, y la bibliografa ttcnica
parece indicar una utilizacin creciente de esta densidad para este propsito.
La distribucibn deWeibull se ha empleado de manera amplia para representar
el tiempo previo de falla, y su naturaleza es tal que puede establecerse para
aproximar con bastante precisin el fen6meno observado. Cuando un sistema se
compone de varios componentes y la falla se debemhs
al serio deun gran nmero
de defectos o defectos posibles, la distribucin de
Weibull funciona en particular
muy bien como modelo.
La distribucin gamma se produce con frecuencia a partir de la modelacin
de la redundancia de reserva donde los componentes tienen una distribucin
exponencial del tiempo de falla. Investigaremos la redundancia de reserva en la
seccin 17-6.5.
17-6.2 Modelo exponencial del tiempo de falla
otro
t20
en
(17-27)
~ ( t =) P [ T > t ] = e-"
= o caso otro
t 2O
en
(17-28)
=o
caso
703
17-6 INGENIERIADECONFIABILIDAD
''
h(t)
: t
c) Funci6n de riesgo
h(r)
f(t)
--x
t 2 0
R(t)
=o
otro
en
(17-29)
caso
P(t I
T st
+ At(T> t } =
- e-X(r+A~)
e-X,
=
1-
e-AAr
(17-30)
704
j ( t ) = (1.5
X 10-5),-(1.5~10-~)f
= ocaso
otro
en
t20
otro
en
~ ( 1=
) e-(1.5X10-5)t
= ocaso
2O
Y
h ( t ) = 1.5
10-5
t 2 0
= ocaso
otro
en
Para determinar la confiabilidad en t = lo4 y t = lo5,evaluamos I?( lo4) = e-.
= .86071, y R(105) = e-. = .22313.
17-6.3
. . .. . P ( T , > t )
R ( t ) = R,(t) . R , ( t ) . .. *
donde
P [ I ;> t ]
Rj(t)
R,(t)
(17-31)
17-6
INGENIERIA
DE CONFIABILIDAD
706
Ejemplo 17.9 Tres componentes deben funcionar para que un sistema simple
funcione. Las variables aleatoriasT I ,T2 y T3 que representan el tiempo de falla
para los componentes son independientes conlas siguientes distribuciones:
T~ ~ ( X2103,4 X 104)
T2
- Weibulliy
O,&
1,B
por lo que
[l - Q,(.935)][e-3][1 - @(-1.154)]
= .O076
Para el sistema simple en serie, la confiabilidad del mismo puede calcularse
empleando el producto de las funciones de confiabilidad de los componentes
comosedemostrd;sinembargo,cuandotodosloscomponentestienenuna
distribucibn exponencial, los chlculos se simplifican
en gran medida puesto que
R(t)
e-A~t.
e-A2t..
.e-X.1
e-(A,+A2+
'.. +A,)t
R( t )
e-','
(17-32)
706
1.3 X
1.7 X
1.2 X
6.1 x
Circuitos integrados
Diodos
Capacitores
Resistores
10-9
10-7
10-7
lo-@
Por tanto,
X,
3(.013
3.9189 x
l o A 7 )+ 12(1.7 X lo)
+ g(1.2 X
+ 15(.61 X
10)
MTTF
1I
E [ T ] = - = -x
X,
3.9189
lo6 = 2.55
lo5 horas
17-6.4
c1
c2
m
0
C"
R(t)=
(i)[r(t)l*[l- r(r)]~~-~~
k-1
1-
( : ) [ r ( t ) ] " [ l- r ( t ) ] t " x
( 1 7-33)
x=o
3[r(t)]'[l- r(t)]
[ r ( t ) I 2 [ 3- 2 r ( t ) ]
+ [r(t)]'
R ( t ) = 1-
[I - R , ( ' ) ]
(17-34)
j=l
El producto es la probabilidad de que todos los componentes fallen y, obvialos componentes son identicos
mente, si no fallan, el sistema sobrevive. Cuando
708
(17-35)
(17-36)
x=k
(17-37)
u
Figura 17.22
Redundanciaenalerta.
709
entonces
e-Aq2
= Ze-A'
- e-2A'
17-6.5 Redundanciaenalerta
T = T,
+ T, +
+T,
donde T, es el tiempo de falla para el componente idsimo y T,, T,, . . . , T,, son
variables aleatorias independientes. El valor mas comn para n en la prktica es
dos, de modo que el teorema central del lmite es de poco valor. Sin embargo,
sabemos de la propiedad de combinaciones lineales que
n
W I = r=l
cJ
Y
w )
710
=o
caso
en otro
MlTF
E [ T ] = n/X
(17-39)
Y
V [ T ]= n/X2
(17-40)
respectivamente.
MlTF
2/100"
200
y la varianza es
v [ r ]= 2/(100-1)*
20,000
La funci6n de confiabilidadR es
1
R(t)=
e"OOL'(lOO-lt)k/k!
k=O
711
712
des el estimador de
mxima probabilidad de 8. Para mayores detallesy resultados
de las distribuciones de tiempo de falla especficas, refirase a Nelson (1982).
17-6.8 Estimaci6n con la distribuci6n de tiempo de falla exponencial
k ( t >= e-(/'
y
et/Ju
(17-43)
(17-44)
dL y eZ,son los
Q=
t,
1- 1
+ ( n - r)t*
(17-45)
DE
17-6 INGENIERIA
713
tj
+ ( n - C)t*
(17-46)
J= 1
Q=
ti
i=l
j=1
t,
+ ( n - r - c)t*
(17-47)
(17-48)
Entonces
1
..
8=
t,
;=I
+ ( n - r)t*
r
= -
(17-49)
$ = Q/r
(17-50)
te
714
Nmero
del
Nmero
fijado
fallas
deTiempo
fijado
terminacidn
de
limite
1"
t*
20
7m]
;
20
X a ,2r
tabla pueden utilizarse directamente con las ecuaciones 17-43 y 17-44 para
establecer lmites de confianza en R(t). Debe notarse que este procedimiento de
prueba no requiere que la prueba se ejecute en el tiempo en el cual se requiere
una estimacidn de confiabilidad. Por ejemplo, 100 unidades pueden ponerse en
200 horas, estimarse el pariimetro 8 y calcularse
una prueba sin reemplazo durante
k(lOO0). En el caso de la prueba binomial mencionada antes, sera necesario
ejecutar la prueba durante 1000 horas.
Sinembargo, los resultados son dependientesdela suposici6n deque la
distribucidn es exponencial.
Algunas veces es necesario estimar el tiempo tR para el cual la confiabilidad
serh R. Para el modelo exponencial, esta estimacibn es
iR=
1
log, R
(17-51)
Ejemplo 17.15 Veinte artculos se someten a una prueba con reemplazo que se
realizarii hasta que ocurran diez fallas. La dtcima falla ocurre a las 80 horas, y el
ingeniero de confiabilidaddesea estimar el tiempo medio de falla, lmites de dos
lados del 95 por ciento en 8, R(lOO), y lmites de dos lados del 95 por ciento en
R(l00). Por ltimo, tambitn desea estimar el tiempo en el cual la confiabilidad
ser .8 con estimaciones de intervalo de confianza puntual de dos lados puntual
y del 95 por ciento.
TABLA 17.5 Lmites de confianza en fR
Naturaleza
Nljmero
del
Lmites de
dos lados
Lmite de un
lado. inferior
fallas
fijado
de
t"
20 log e (1 / R) 2 0 log e (1 / R)
~?/2,2r
20 log Le (1 / R )
X1 - a / 2 , 2 r
2Qloge(1 / R ) 2Qloge(a/R)
~ ? / 2 , 2 +r 2
2Q log e (1
/ R)
X-:
a/2,2r
715
,-100/333.65]
= [ . 3 4 ; .741]
Ademhs,
,T.
.S
horas
9.591
120.9; 74.451
No es raro que el comprador pruebe los productos que adquiere para asegurarse
de que el vendedor concuerda con las especificaciones de confiabilidad. Estas
pruebas son destructivas y, en el caso de lamedici6n de atributos, eldiseflo de la
prueba sigue lo correspondiente al muestreo de aceptacidn tratado antes en este
captulo.
Un conjunto especial de planes de muestreo que supone una distribuci6n de
tiempo de falla exponencialse ha presentado en el manual del Departamento de
Defensa de EstadosUnidos (DOD H-108), y estos planesse utilizan ampliamente.
716
17-7 Resumen
Este captulo ha presentado varios mdtodos de amplia aplicacin para el control
de calidad estadstico. Se presentaron los diagramas de control y se trat6 su
utilizaci6n como dispositivo de supervivencia del proceso. Los diagramas de
control y R se emplean para datos de medicin. Cuando la caracterstica de
calidad esun atributo, pueden emplearse el diagramap para
la fracci6n defectuosa
o eldiagrama c o u para los defectos. Se present6 tambiCn el muestre0de
aceptacin como una ttcnica para estimar la calidad del lotey brindar guas para
el ordenamiento delmismo.
Tambitn se trat6 el empleo probabilidad
de
como una tkcnica de modelado en
el analisis de confiabilihad. La distribucin exponencial se emplea de manera
extensa comola distribuci6n del tiempo de falla, aunque otros
modelos plausibles
incluyen a las distribuciones normal, lognormal, Weibull y gamma. Los mdtodos
del anhlisisdeconfiabilidaddesistemasse
presentaron para elcasode los
sistemas en serie, as como de los que tienen redundancia activa o de reserva.
Ademas se trat6 de manera breve la prueba de duraci6n y la estimacin de la
confiabilidad.
17-8 Ejercicios
17-1 Un dado deextrusi6n se emplea paraproducir barras de aluminio.El dikmetro de las
calidad crtica. A continuacih semuestran los valores
Larras es una caracterstica de
X y R para 20 muestras de5 barras cadauna. Las especificaciones en las barras son
,5035 2 .O010 pulgadas. Losvaloresdados son los ltimostresdgitosde
las
2
3
4
5
6
7
8
9
10
x
34.2
31.6
31.8
33.4
35.0
32.1
32.6
33.8
10 34.8
38.6
R
Muestra
3
11
12
434.0
13
436.0
14
5
15
435.2
2 33.4 16
7
934.4
434.0
17
18
19
20
35.4
37.2
6
4
7
3
35.0
10
4
7
33.9
a
4
17-8 EJERCICIOS
717
Suponga que se utiliza un diagrama? para controlar un proceso distribuido normalls muestras detamao II se toman cadah horas y que se grafican en
mente, y quea
el diagrama, el cual tienek limites sigma.
a) Encuentre el nmero esperado de muestras que se tomaran hasta que se genere
una seAal de acci6n falsa. Esto se llama longitud de ejecuci6n promedio
(LEP)
bajo control.
b ) Supongaqueelprocesocambiaaunestadofueradecontrol.Encuentreel
nmero esperado de muestras quese tomariin hasta que se genere una accibn
(LEP) fuera de control.
falsa. Estose llama longitud de ejecuci6n promedio
c ) Evale la LEP bajo control para k = 3. iC6mo cambia si k = 2? Que piensa
usted acerca del empleo de lmites de 2-sigma en la practica?
S, Evale la LEP fuera de control para un corrimiento de una sigma, dado que
n = 5.
17-4
25
=
1-1
Ri = 8.60
362.75
i=l
17-5
Suponga un diagramai para un proceso bajo control con lmites 3-sigma. Se extraen
muestras de tamafo 5 cada 15 minutos, al cuarto de hora. Suponga ahora que el
proceso se sale de control en 1S O por 10 minutos despuCs de la hora. Si D es el
nmero esperado de defectos producidos por cuarto de hora en este estado fuera de
control, encuentre la perdida esperada (en terminos de unidades defectuosas) que
resulta de este procedimiento de control.
17-6
718
acibn
Observaci6n
4
3 Muestra
2
15
14
Muestra
19
8
10
2
6
10 1014 8
15
10
3
9
912 11 8
10
4
6 14 9 12
1 3 15
5 12
14
9
8
6 13
97
10
8
14
7
15 12 10
12
8
8
16
11 910 10
9
11
7 101016 15
13
10
11
14
11
12
14
a)
b)
11
12
13
14
15
16
17
18 14
19
20
1
1
42
3
3
8
9
14
13
9
8
16
16
10
9
9
6
5
12
8
8
17-7 Los siguientes son los nmeros de uniones de soldaduras defectuosas en muestras
Da
Nm. d e defectos
Da
Nm.
defectos
de
1
2
3
4
5
6
7
8
9
10
106
116
164
89
99
40
112
36
69
74
11
12
13
14
15
16
17
18
19
20
21
42
37
25
88
1o1
64
51
74
71
43
80
17-8 EJERCICIOS
719
con probabilidad de
.50 en la primera muestra que sigue al corrimiento a este estado.
Obtenga una f6rmula general para el tamao de muestra que debe emplearse en este
diagrama.
17-10 Un
proceso distribuido normalmente emplea66.7 por ciento de la banda de especificacibn. Esta centrado en la dimensidn nominal,y se localiza a la mitad entre los
lmites de especificaci6n superior e inferior.
a) Cuhl es la raz6n de capacidad del proceso RCP?
b) Que nivel de fallas (fracci6n defectuosa) se produce?
c) Suponga que la media se corre a una distancia de exactamente3 desviaciones
Cual es el valor de
estandar por debajo del lmite de especificaci6n superior.
RCP,? iC6mo ha cambiado la
RCP?
S) LCuhles son las fallas reales quese experimentan despues del corrimiento en la
media?
defectos producidos? Suponga ahora que la media se corre a 105 y que estamos
4 sobre undiagramax. Cub1 es la probabilidad de
usando un tamailo de muestra de
que tal corrimientose detecte en la primera muestra posterior al corrimiento?
Que
tamailo de muestra seria necesario en un diagrama
p para obtenerun grado similar
de proteccibn?
17-12 Suponga
.1o
.13
.O8
.14
.o9
.1o
.15
.13
.O6
.O3
.O5
.13
.1o
.14
.O7
.O6
.o9
.O8
.11
.12
.14
.o6
.O5
.14
.11
.o9
.13
.12
.o9
17-13 Lo
720
que se conoce que en promedio hay dos defectos por unidad. Si decidimos hacer
e, y
nuestra inspeccibn por unidad para cinco mbdulos de disco en el diagrama
controlar el nmero total de defectos por unidad de inspeccibn, describa el nuevo
diagrama de control.
17-17 Considere los datos en el ejercicio 17-13. Haga un diagrama u para este proceso.
I
acerca de la forma de la
curva. Bosqueje la curva CO para n = 40 y c = 1 sobre la
misma grhfica. Compare las formas y comente acerca de los problemas potenciales
asociados con un plan de muestreo deaceptacibn con c = O .
17-22 Una muestra de tamao n = 10 se extrae de un lote que contiene 500 artculos. La
a N.
17-24 En una muestra aleatoria de tamao n = 20 de un proceso que produce tubos, el
espesor medio fue de .2518 pulg y la desviacih esthndar de .O005 pulg. Suponga
17-8 EJERCICIOS
721
17.-25 Suponga que se obtienen los pesos de30 unidades, d h d o s e una media de muestra
de 24.32 onzas y una desviaci6n estiindar de .O3 onzas. Suponiendo que el peso se
distribuye normalmente, construya un intervalo de tolerancia para a = .O5 y p =
.90. Interprete este intervalo de tolerancia.
17-26 Una distribucibn deltiempo de falla esta dada
por una distribucih uniforme:
=o
encaso
otro
a)
b)
c)
d) Demuestre que
R( 1 ) = e ~ ~ / l ( t )
Donde H se define como en la ecuacibn 17-24.
17-27 Tres unidades que operan y fallan en forma independiente forman
una configuraci6n
10
La distribucidn del tiempo de fallapara cada unidad es exponencial con las tasas de
falla que seindican.
a) Encuentre R(60)para el sistema.
b ) ~ C u h es
l el tiempo medio de falla para este sistema?
17-28 Cinco unidades idknticas
de
reserva con un interruptor de decisin perfecto y s6Io se requiere una unidad para la
supervivencia del subsistema, determine la
confiabilidad de este ltimo.
17-30 Cien unidades se ponen a prueba y se envejecen hasta que todasfallan. Se obtienen
722
o- 100
100- 200
200 - 300
300- 400
400 - 500
Despues de 500 horas
= 160 horas
a partir de
fallas
50
18
17
8
4
3
=o
en otro caso
supone que las unidades tienen una distribucin de tiempo de falla exponencial, y
que se probaroninicialmente 1O0 unidades.
a) Estime el tiempo medio de falla.
b ) Construya un lmite de confianza inferior del 95 por ciento respecto al tiempo
medio de falla.
17-34 Emplee el planteamiento del ejercicio 17-33.
a)
Captulo 18
Procesos estocsticos y lneas
de espera
18-1 Introduccin
El trmino proceso estocstico se emplea con frecuencia en conexi6n con observaciones provenientes deun proceso fsico distribuido en el tiempo y controlado
por medio de un mecanismo aleatorio. De modo mas preciso, un proceso estocastic0 es una secuencia de variables aleatorias ( X i } , donde t E T es un ndice de
tiempo o secuencia. El espacio del rango para X , puede ser discreto o continuo;
sin embargo, en este captulo consideraremos solamente el caso en que en un
punto particular t, el proceso esta exactamente en uno de los m + 1 estados
mutuamente excluyentes y exhaustivos. stos se designan O, 1,2,3, . . . ,m.
Las variables X , , X,, . . . , podran representar el nmero de clientes que
esperan su turno en una taquilla en los tiempos 1 minuto, 2 minutos, etc., despus
de que la taquilla abre. Otro ejemplo seria la demanda diaria de cierto producto
en das sucesivos. X,,
representa el estado inicial del proceso.
En este captulo sepresentara un tipo especial de proceso estocastico llamado
proceso de Markov. Tambin trataremos las ecuaciones Chapman-Kolmogorov,
diversas propiedades especiales de las cadenas de Markov, las ecuaciones de
nacimiento-muerte, y algunas aplicaciones a problemas de lnea de espera y de
interferencia.
En el estudio de los procesos estocasticos, se requieren ciertas suposiciones
acerca de la distribuci6n de probabilidad conjunta de las variables aleatorias X , ,
X,,. . . . En los casos de los ensayos de Bernoulli, presentados en el captulo 6,
recurdese que estas variables se definieron como independientesyque
su
recorrido (espacio de estado)constaba de dos valores (O, I). Aqu consideraremos
724
P{ X,,, = j j X ,
z}
P( X,,, = j l X ,
= i , X,-l = i,,
X,-*
i2,.. ., X ,
it}
(18-1)
P ( X,,, = j l X ,
i}
P( X, =jlX,
i}
para t
0,1,2, . . . (18-3)
o 2 p , , II
en tanto que
nl
p,,
para i
0 , 1 , 2 ,..., m
,=o
i } =
P{ X,, = j l X ,
i }
(18-4)
18-2
DE CADENASTIEMPO
MARKOV,
725
DISCRETO
donde
Y
nz
Cp,'y)=~
/=o
n = O , 1 , 2 ,...
i = O , 1 , 2 ,..., m
p;;) =
py) .
/=o
p r-
0'
i = O , 1 , 2 ,..., m
j = 0,1,2 ,..., m
O s v s n
(18-5)
nl
/=o
p,,py'
/=o
p,';t-l).p,,
i = 0 , 1 , 2,..., m
j = 0 , 2 , 3 , ..., m
n = 0,1,2, ...
726
donde
p4 =
[ .375
.688
.625
[ .664
.668
3121
p3 =
3321
.336
p5
[ .344
.672
.656
[ .666
.667
.334
-333
A .p .p
pL
18-3
727
proceso vaya la primera vez del estado i al estado j se llama primer tiempo de
paso. Si i = j , entonces ste esel nmero depasos necesarios para que el proceso
regrese al estado i por primera vez, y se denomina primer tiempo de retorno o
tiempo de recurrencia para el estado i.
Los primeros tiempos de pasoen ciertas condiciones son variables aleatorias
con una distribucin de probabilidad asociada.
Dejamos que f jj') denote laprobabilidad de que el primer tiempo de paso del iestado
alj sea igual n,
a donde puede
mostrarse directamente del teorema 2-5 que
!,y) =
fly) . p:;"-" - A y )
.p;;-*) - . . . - f,,
(n-1)
P,,
(18-8)
Ejemplo 18.2 Empleando las probabilidades de transici6n deun paso presenta18. I , la distribucin del indice n del tiempo de paso
se determina
das en el ejemplo
como se indica a continuacin para i = 0 , j = 1.
=
pol = .250
fd;" = t.328)
.187
(.25)(.375) - (.187)(.5)
.141
.lo5
ljt)
fjj'),
128
puesto que hay una probabilidadpositiva de que dado que elproceso se encuentra
en el estado i, nunca regresar a este estado. No siempre es fcil clasificar un
estado como transitorio o recurrente, puesto que por lo general no es posible
calcular las probabilidades del primer tiempo de paso para toda n como fue el
caso en el ejemplo 18.2. Aunque puede ser difcil calcular lasft) para toda n, el
tiempo de primera transicin esperado es
y si Z
:==
,f$) = 1, puede demostrarse que
(18-10)
729
converge cuandon
00, y la distribucin lmitees independiente de las probabilidades iniciales,A. En el ejemplo 18.1 se observ claramente que este era
el caso,
y despus de cinco pasos (n > 5), P(X, = O) = .667, y P{X, = 1) .333 cuando
se emplean tres cifras significativas.
En general, para cadenas de Markov ergdicas e irreducibles,
111
2.
Cp,=l
/=o
01
3. p,
Cp;p,,
j = 0,1,2 ,..., m
(18-11)
l=O
Puesto que hay 112 + 2 ecuaciones en (2) y (3) arriba y hay m + 1 incbgnitas, una
de las ecuaciones es redundante. Por tanto, emplearemos m de las m + 1
ecuaciones en (3) con la ecuaci6n (2).
P o = 2/3
P 1 = 1/3
7 30
.=
JJ
j = 0,1,2 ,..., m
(18-12)
p/
O: Bueno(animado)
1: Adecuado (irregular)
2: Pobre (triste y deprimido)
El psiclogo observa que loscambios de nimo ocurren slo durante lanoche: de
tal modo, los datos permiten la estimacin de las siguientes probabilidades de
transicin:
[ .o
.6
.3
.2
.4
.3
.2
.1]
.7
=
=
1 = Po + PI + P2
731
18-4 CADENAS
CONTINUO
TIEMPO
DE MARKOV,
llama probabilidad deabsorcibn, la cual es laprobabilidad condicional de absorci6n en el estado k dado el estadoi. En forma matemhtica, tenemos
m
pi; blk
b,, =
0 , 1 , 2 ,..., m
(18-13)
j=O
donde
+k
i = O , 1 , 2 ,..., m + l
p , , ( t ) = ~ [ ~ ( t + s ) = j l ~ ( s ) = ij =] 0 , 1 , 2 ,..., m + l
s 2 O , t 2 0
1-0
O
1
i + j
i=j
Hay una correspondencia directa entre los modelos de tiempo discreto y los
de tiempo continuo. Las ecuaciones deChapman-Kolmogorov se convierten en
m
A,([)
P,/(U)
.P / J f
- u)
(18-14)
/=O
CAPITULO 18 PROCESOS
ESTOCASTICOS
732
Y LNEAS DE ESPERA
una clase y, donde la cadena es irreducible (todoslos estados forman una nica
clase)
p,,(t) > O
t >O
P, > 0
m
Cp,=l
/=o
el
pl= C ~ ; p , ~ ( t ) j = 0 , 1 , 2 ,..., m ;
,=o
t20.
lm
i.
(18-15)
= - ,p,(t)l1=o
p,.u,= Cpi.u,,
j = 0 , 1 , 2 ,..., m
(18-17)
i#/
18-4
DE CADENAS
MARKOV,
CONTINUO
TIEMPO
733
iddnticas para estos mddulosy, ademhs, cuando un m6dulo fallay entra al taller,
y se inicia de inmediatoel trabajo dereparaci6n.
otro mecanismose mueve al lado
El sistema en este caso est6 compuesto por el mecanismo y la instalaci6n de
reparaci6n y los estados son
= Ae-*
t2O
=o
t < O
r T ( t ) = pe
t 2
=o
t<O
Los tiempos entre falla y entre reparaci6n son independientes, y puede demostrarse que (X(t)}ser6 una cadena de Markov irreducible de
pardmetro continuo
1, 1
O, I
2,
con transiciones s610 de un estado a sus estados vecinos: O
2
1. Desde luego, es posible que no haya cambio de
estado.
Las intensidades de transicibn son
lo =
( x + I*)
UI2 = x
2x
u1 =
uol = 2 x
u20
=o
=P
u21
= 2P
UO2 =
u10
u2 = 2 p
PP1
Y, comoPo +PI + Pz = 1
APl
-+
734
= 1-
A2
( A + PI2
p=
[{ P,,(W}]
r(l
-uoAt)
( ul0 A t )
(u0,At)
(1 -
uI A t )
*.-(uOJAt)
..*(U~,A~)
. . ( ulJ A t )
. . . (ulmA t )
- . -( u l n 1 A t )
u,oAt)
(uilAt)
... ( u i J A t )
(U,,,, A t )
( uml A t )
. . . ( u r n JA t )
. . . (1 - U,
De la jesima ecuacih
en las m
p,(t
At)
(18-18)
18-5
735
pi'(?) = - u j . p j ( t )
zuii.pi(t)
J=0,1,2,
..., m
(18-21)
i+j
18-5 Procesosdenacimiento-muerte
en lneas de espera
La principal aplicaci6n en el proceso de nacimiento-muerte que estudiaremos es
la teora de colas o de lnea de espera. En consecuencia, nacimiento se referirh
al arribo y muerte a lasalida de un sistema fsico, como se muestra
en la figura
18.1.
La teora de linea de espera es el estudio matemhtico
de lneas de colaso de
espera. Estas lineas de espera ocurren
en una diversidad de ambientes delproblemas. Hay un proceso de entrada
o "poblaci6n demandante"y un sistema de colas,
que en la figura 18.1 se compone de la instalaci6n de colas y de servicio. La
Sistema
r-----------
I
I
Proceso
de entrada
Arribos
I
I
'
Y"
espera
Linea
de
L """_
Figura ld.1
Instalaci6n
de servicio
"
"
I
736
poblaci6n demandante puede ser finita o infinita. Los arribos ocurren de una
manera probabilstica. Una suposicin comnes que los tiempos entre arribos se
distribuyen exponencialmente.La cola se clasifica por lo general de acuerdo asi
su capacidad es infinita o finita, y la disciplina de servicio serefiere al orden en
el cual los clientes enla cola obtienen el servicio. El mecanismo de servicio consta
de uno o mhs servidores, y el tiempo que tardael servicio se llama comlinmente
tiempo de espera.
Se empleara la siguiente notaci6n:
...
...
...
...
P-
Lo
...
...
737
...
PI At
u ; APj~ 1At
bAt
Pjtc At
u. = A,
uj=(xj+p,)
p a r a j = 1 , 2 , ...
u i j = x,
para j = i
+I
para j = i - I
=o
p a r a jj >< ii +- l1,
El hecho de que las intensidades de
transici6n y las intensidades de paso sean
constantes con el tiempo es importante en el desarrollo de este modelo. Puede
verse que la naturaleza de la transici6n serh especificada por la suposicibn, o
puede considerarse como un resultado de la suposici6n anterior acerca de la
distribucidn de tiempo entre ocurrencias (nacimientosy muertes).
Lassuposicionesde tiempos deserviciodistribuidosexponencialmentee
independientes y de tiempos interarribosdistribuidos en forma exponencial
produceintensidadesde transici6n constantes en el tiempo. Esto tambidn se
observd en el desarrollo de las distribuciones de Poisson y exponencial en los
captulos 6 y 8.
Los mdtodos utilizados en las ecuaciones 18- I9 a la 18-2 1 pueden emplearse
para formular un conjunto infinito de ecuaciones de estado diferenciales de la
matriz de transici6n de la ecuaci6n 18-22. Por consiguiente, el comportamiento
dependiente del tiempo se describe enla siguiente ecuaci6n:
= Pi
P M
-hoPo(t) +
PlPl(t)
+ EL,+,
* ~ J + l ( t ) j = 1,2,***
( 18-24)
+ PI> . P J ( ~ +
) ',-1Pj-l(')
~ ; ( t )= - ( A ,
m
En el estado estable (t
m),tenemos p;{t) = O, por lo que las ecuaciones de
estado estable se obtienen delas ecuaciones 18-23
PlP1 = X O P O
hopo + P 2 P 2
XlPl
(X, + P l ) 'PI
P3P3 = 0
+ 11.2)
'P2
738
y zj=np=
j 1.
Las ecuaciones 18-25 tambienpodranhabersedeterminadomediantela
aplicaci6n directa de la ecuaci6n 18- 17, la cual brinda un balance de tasa o
balance de intensidad. Al resolver las ecuaciones 18-25 obtenemos
P1
X0
= -Po
Pl
Al
P2=
-P1=
P2
- . Po
P2P1
(18-26)
Entonces
p,= C j . p o
j = 1,2,3,..
y como
m
Cp,=l
PO+
C p , = l
/=1
j=O
1
Po
1+
&,
(18-27)
j= 1
Estos resultados delestado estable suponen que los valores X, pJ son tales que
puede alcanzarse un estado estable. Lo anterior ser cierto si X, = O para j > k,
18-6
CONSIDERACIONES
EN
739
t 2
=o
t < O
rT(t) =
p e p~f
=o
tLO
t<O
lneas de espera
L, = I:,=o ( j - S) .pJ = Longitud prevista de la lnea de espera
W = Tiempo de espera previsto para el sistema
Ul,
= Tiempo
xw
(18-28)
Y
L,
Si las AJ no son iguales,
AW,
1 sustituye a A, donde
(1 8-29)
740
w = w,+-
(18-30)
A las tasas 5, Al, . . . , Aj, . . . , y yl, p2,. . . ,yJ, . . . , del proceso nacimiento-muerte puede asigniirseles cualesquiera valores positivos siempre y cuando la
asignaci6n conduzca a una soluci6n de estado estable. Esto permite bastante
flexibilidad al emplear el resultado dado en la ecuaci6n 18-27. Los modelos
especficos presentados diferirhn en la manera en la cual A, y yj variarhn como
funci6n dej .
y de la ecuaci6n 18-27
p,
Po
j = 1,2,3,. .
pJpo
1
00
1+
CPJ
=1-p
(18-32)
J=1
(1 - p)pJ
j =
o, 1 , 2 , . . .
(18-33)
741
j . (1 - p)p
=
j=O
= -
(18-34)
1-P
y la longitud prevista de lnea de espera
W
L,=
=
C1 ( j - 1) * p J
j=
L - (1 - P o )
x2
(18-35)
P b - A)
L
w==
X(1-p)
=-
(1 8-36)
p-x
742
(18-38)
el cual seve como el complementode la funcin de distribucinpara una variable
exponencial con parmetrop( 1 -p). El valor W = 1/p(1 - p) = l/p- A se obtiene
directamente.
Si dejamos que S, represente el tiempo en la cola, excluyendo el tiempo de
servicio, entonces
o) = p a = 1 - p
P(S,=
Si tomamos
como la suma de j tiemposdeservicio,
distribucin gamma. Entonces,
p(sq
'w,> =
c P, . p ( q 'w,)
/=I
m
c (1 -
P I P ' . p(T,
1x1
pe-"('-P)Wq
=o
'w,)
wq >
w4 <
-[I
pe-p('-P)wq]
(18-39)
p(1 - p)pe-'"-~)~q
wq > 0
dw,
En consecuencia, la distribucin de probabilidad es
dw,)
X(1
P
-
p)e
(P
x ) '$4
wu > 0
( 18-40)
w,= ( I
- p) .0
T.
wy X ( l - P).
'
(p
"%lw,
( 18-41)
18-8
SERVIDOR NICO
CON
LINEA
DE ESPERA DE LONGITUD
LIMITADA
743
x -x
h J. = O
j 2 N
=o
j > N
(18-42)
Por tanto,
Y
1
I - P
( I 8-43)
/=1
= pJ[
1 - pN+l]
j = O , 1 , 2 ,..., N
(18-44)
744
1- ( N
=P[
+ 1 ) p N + NpN+l
(1 - P ) ( l - P N + ' )
(18-45)
C ( j - 1) ' P j
=
J"1
C jp, - C P,
J=1
j=O
(18-46)
L - (1 - P o )
L
w =-
(18-47)
y el tiempomedio en la cola es
(18-48)
donde L esta dada por la ecuaci6n 18-45.
xo = x 1 -
... = A J
...
Y
p, = j
=
.p
sp
para j S
.S
para j >
=x
(1 8-49)
745
Por tanto,
(1 8-50)
Se deduce de la ecuaci6n 18-27 que las ecuaciones de estado se desarrollan
como
(18-51)
[s!(l - P I 2 ]
(18-52)
746
Entonces
(18-53)
Y
1
w = w9+P
(18-54)
por lo que
L=
iw,+-:i
=L,+r$
(18-55)
Hay un gran nmero de otros modelos de lneas de espera que pueden desarrollarseapartirdelprocesode
nacimiento-muerte. Ademas, tambikn es posible
desarrollar modelos deformaci6n de lneas de espera en situaciones
que comprenden distribuciones no exponenciales. Un resultado til, dado sin desarrollarse,
corresponde a un sistema de un servidor que tiene interarribos exponenciales y
distribuciones de tiempo de servicio con medial / p y varianza u 2. S i p = A/p
< 1, entonces, las mediciones del estado estable estan dadas por las ecuaciones
18-56.
w = W q +P
(18-56)
18-12 EJERCICIOS
747
18-1 1 Resumen
Este captulo present6 la noci6n de procesos estocasticos de espacio de estados
discretos con orientaciones de tiempo discreto y tiempo continuo. El proceso de
Markov se desarro116 junto con la presentaci6n de las propiedadesy caracteristicas del estado. A esto sigui6 una presentaci6n del proceso del nacimiento-muerte
y varias aplicaciones importantes para los modelos de lneas de espera en la
descripcibn de fen6menos de tiempo de espera.
18-12 Ejercicios
18-1 Un taller de reparacibn de calzado en una zona suburbana tiene
un solo operario.
18-2 Se analizalos datos del estado del tiempo en una localidad particular,
se emplea
y
una cadena de Markov como modelo para el cambio de clima como sigue. La
probabilidad condicional del cambio de lluvioso a despejado en
un da es .3. De
igual manera, la probabilidad condicional de transici6n de despejado a lluvioso
en un da es . l . El modelo sera de tiempo discreto, con transiciones que ocurren
s610 entre das.
a) Determine la matrizP de las probabilidades de tr'ansici6n deun paso.
b) Encuentre las probabilidades de estado, de estado estable.
c ) Si hoy esta despejado, determine la probabilidad de que est6 despejado exactamente de aqu a tres das.
d) Encuentre la probabilidad de que el primer paso de un da claro a uno lluvioso
ocurra en dos das exactamente, dado que el da claro
es el estado inicial.
e ) CUB1 es el tiempo de recurrencia media para el estado de da lluvioso?
18-3 Un
enlace de comunicaciones transmite caracteres binarios (O, 1). Hay una probareceptor,
bilidadp de que
un caracter transmitido sera recibido correctamente unpor
que luegol o transmite a otro enlace, etc.X,Sies el carhcter inicial
y X,es el caracter
recibido despues de la primera transmisibn,
X, despues de la segunda, etc., entonces
{X,,} es la cadena de Markov con independencia. Encuentrela matriz deun paso y
transici6n de estado estable.
"
"
..
.
b)
C)
Noserequierecorrecci6n.
Se requiere una correcci6n menor.
Se requiere una correcci6n mayor.
Aborto y destrucci6n del sistema.
Si {X,} puede modelarse como una cadena de Markov con una matriz de transici6n
de un paso como
/ 1
2/3
P=
O
\ o
1/6
2/3
1/6
1/6
o \
O
1/6
1
18-12
EJERCICIOS
749
634.
18-7 Un objeto se mueve entre cuatro puntosen un crculo, los cuales se denotan 1 , 2 , 3
y 4. La probabilidad de moverse unaunidad a la derecha esp , y la probabilidad de
moverse una unidad a la izquierda es 1 - p = q. Suponga que el objeto empiezaen
1, y deje queX, denote la localizaci6n de un crculo despues de
n pasos.
a) encuentre la matriz P de transicidn de un paso.
b ) Determine una expresin para las probabilidades del estado establepj.
c ) Evale las probabilidadespj parap = .5 y p = .8.
18-10 Los automviles arriban a una gasolineria de manera aleatoriaa una tasa media de
15 por hora. Esta gasolineriaslo tiene un puesto deservicio, con una tasa media de
distribuyen exponencialservicio de27 clientes por hora. Los tiempos de servicio se
mente. Slo hay espacio para el automvil que se est atendiendo y para dos que
esperan. Si los tres espacios estrin llenos, el autom6vil ir a otra gasolinera.
a) Cul es el nmero promedio de unidades en la gasolinera?
b ) Qu fraccin de clientes se perder?
c ) Por qu es L, $ L - I ?
_"
"
"
"
"
"
750
18-12 La frecuencia media de arribosa un aeropuerto es de18 aviones por hora, yel tiempo
medio que una pista est reservada para un arribo es de 2 minutos. Cuntas pistas
tendrn que proporcionarse de modo que laprobabilidad de que un avibn tenga que
esperar sea .20? Ignore los efectos de poblaci6n finita y haga la suposicin de
interarribos y tiempos de servicio exponenciales.
18-13 Una agencia dereservaciones de hoteles utiliza lneas internas WATS para atender
las solicitudes delos clientes. El numero medio de llamadas quellegan por hora es
de 50, y el tiempomedio de servicio para una llamadaes de3 minutos. Suponga que
los interarribos y los tiempos de servicio se distribuyen en formaexponencial. Las
llamadas que llegan cuando todas laslneas estn ocupadas reciben la sefa1 de
ocupado y el sistema laspierde.,
a) Encuentre las ecuaciones de estado, de estado estable, del sistema.
b ) Cuntas lneas WATS debe brindarse para asegurar que la probabilidad de que
un cliente obtenga lasefal de ocupado sea.05?
c ) En que fraccibn de tiempo estn ocupadas todas las lneas WATS?
d) Suponga que en las horas de la noche, las llegadas de llamadas ocurren a una
tasa media de10 por hora. LC6mo afecta esto la utilizacih de la lneas WATS?
e ) Suponga que el tiempo de servicio estimado (3 minutos) es un error, y que el
verdadero tiempo de servicio es
en realidad 5 minutos. Que efecto tendrh esto
en la probabilidad de que un cliente encuentre todas las lneas ocupadas si se
emplea el nmero delneas en u)?
Captulo 19
Teora estadstica de decisiones
752
d ( x,,x,,. . . , X " )
(19-1)
X,,
X,,. . . ,X,,que observamos.
Vemos que la ptrdida es una variable aleatoria y que depende del resultado
de la muestra. Por tanto, elegimos definir elriesgo como el valor esperado de la
funcin de perdida. Esto es, el riesgo, digamosR(d; O), es una funcin de 8, d y
I, tal que
R ( d ;0 )
E ( l [ d ( X , .X2 ....,
x,,);
81)
(19-3)
Es evidente que unabuena funcin de decisin sera una que minimice el riesgo
R(& 0) para todos los valores de 8 en el espacio deparmetros a.
En muchos problemas aplicados, el empleo de la teora de decisin se complica debido a la dificultad de especificar una funcin de pCrdida realista. Por
ejemplo, puede serbastante dificil especificar la prdida realizada estimando en
forma incorrecta el parmetro deuna distribucin de probabilidad,o tomando la
decisin incorrecta cuando se pruebauna hiptesis. Puesto que las ptrdidas son
variables aleatorias,puede ser cuestionable hablar de funcin
la
de riesgo, la cual
es el valor esperado de las pkrdidas, cuando el problema de decisin slo se
encuentra una vez. En la prtictica, una funci6n de prdida
precisa no es en realidad
necesaria, ya que los buenos procedimientos de decisin son insensibles apeque'os errores en la estimacin de la forma de la funcin de prdida. Asimismo, si
las pdrdidas se miden en tdrminos de una funcin de utilidad, podemos medir las
perdidas aleatorias trabajandocon la funci6n de riesgo.
Nos concentraremos en los dos problemas de la inferencia estadstica que se
han tratado en captulos anteriores: la estimaci6n del parhmetro 8, que caracteriza la funci6n de densidad de probabilidadf(x),y la prueba de hip6tesis en tomo
a 8.
ConsidCrese primero el problema de determinar una estimaci6n puntual de 8.
Si la decisi6n consiste
en actuar como si bfuerael valor verdadero de 8, entonces
nuestra funci6n de perdida l(& 6) = O si y s610 si 4 = 8. Nuestra funci6n de
decisi6n es
d ( x,,x,,. . . , X,)
(19-4)
donde h(8) > O para toda 8. Debido a que h(8) desempeia un papel relativamente
menor al determinar losmdritos relativos de dos funciones de
decisibn, a menudo
es razonable fijar h( 8) = 1. Si h(0) = 1 en la ecuaci6n 19-5, la funci6n de pdrdida
se llama funcin de perdida deerror cuadrhtico.
Para una problema de estimaci6n por puntos solemos denominar estimador a
la funci6n de decisidn, y llamamos estimado a l a decisi6n. De tal modo que b es
un estimado o decisibn. Con frecuencia, b tambitn se llama estimador, en cuyo
caso entendemosla funci6n de decisi6n definida en laecuaci6n 19-4. El problema
central de la estimaci6n por puntos es encontrar una funci6n de decisidn d que
minimice la funci6n de riesgo
R ( d ; 6)
h ( 8 ) E (( 6-
o, si h(8) = 1,
R(d;8 )
E(
( e-
CAPITULO ESTADSTICA
19 TEORA
756
DE DECISIONES
(19-12)
Y
(19-13)
Las probabilidades {(d; 9 a menudo se llamanprobabilidades del error,ya que
corresponden a la probabilidad de tomar la decisi6n a2 si 8 esth en wI y a la
probabilidad de tomarla decisi6n a, si 8 esta en y, respectivamente.
Del anhlisis anterior, podemos utilizar los conjuntos o,y y para formar un
enunciado o hip6tesis Ho: 3 o,y una hip6tesis alternativa H I :8 E a+.Por tanto,
la decisibn u1esth aceptando la hip6tesis Ho y la decisi6n a2 esth rechazando la
hip6tesis Ho. La funcidn de decisi6n d, que aplicamos ala muestra x,, x2, . . . ,xtz,
y la cual conduce a aceptar o a rechazar la hip&tesis, se llama prueba de la
hiptesis. Es evidente que debemos desear encontrar una funcidnde decisibn, o
prueba, tal que el riesgo se minimice para todo valor deO en R. En general, no
es posible hacer esto debido a que, para
ciertos valores de 8 una funci6n de
decisi6n puede ser mejor en tanto que para otros valores de 8 una funci6n de
8, nohay un
decisi6n diferente tal vez sea la
mejor.Cuandosedesconoce
planteamiento directo para determinard. Ademb, es posible que no se conozca
la forma apropiada de la funcidn de pkrdida.
Una soluci6n factible a estas dificultades seria seleccionar una funci6n de
decisibn, o prueba, que minimice las probabilidades del error. Sin embargo,
incluso esto no es en general
posible. El procedimiento cliisico es seleccionar una
probabilidad, digamos a,en algunaparte del intervalo .O I S a S .20 y encontrar
el conjunto de funciones dedecisi6n tal que
P(X
SX*l6f wl)
I
a
(19-14)
p(x E S X 1 P E w2)
(19-15)
7 51
bilidad de aceptar H, dado que es falsa, o la probabilidad del error de tipo 11.
Esto es,
P (error del tipo I) = P(X E Sx21eE wl)
P (error del tipo 11)
P(X
sxlIeE w 2 )
P(X
sX2p
E w2)
1 - P(X
sxlleE w z )
(19-16)
e)
paratoda 8 E R
Y
R(d*; e ) < R(d; 0)
paraalguna 8 E R
Puesto que una funcin dedecisin da por lo general un riesgo mnimo para todos
los valores de8en R,parece razonable encontrar la clase de funciones de
decisin
admisibles y seleccionar una de dicha clase.
758
7 59
(19-18)
Xne-A~x~
f( X )
= ke-kA
=o
h>0
otro
en
caso
"-
"
-""
760
de estimacin
19-3Aplicaciones
= E [ R ( d ; O )=
]
1";
R ( d ;O ) f ( O ) dB
-m
761
minimizan
z=I_,
I(&
e>f(etx,, x2,. . ., X , ) d e
(19-23)
x=
n + l
10
C%+k
10 + 1
1500 + 140
.O6707
i=l
Podemos comparar esto con los resultados que se habran obtenido mediante
mCtodos clhsicos. El estimador de maxima similitud del parhmetro A en una
distribucih exponencial es
762
763
(n
n2
+ 1)'/2(2n)"/2 exp
[ ;(
cx2 z)]
f ( P l X * . x2,.
. ., X>>)=
(27r)-+(n
~ x t(n
+ 1)"/2exp
- ( n + 1)1/2
2[
-i
(2n)ll2
-i
( n
+ 1)p2 - 2 n x p 1
( ~ x -:
2 ni$
(n + I)"~
exp
+l)[p-
n+l
n + l
(. n 2 x 21 ) 2
+
GI2)
I)
"
"
."
"
"
764
la informaci6nanteriorylamuestra,habramayordiferenciaentrelasdos
estimaciones. Para una ilustraci6n de esto, refidrase al ejemplo 9.2.
Podemosemplear los mdtodos bayesianos paraconstruirestimacionesde
intervalo de parmetros que son similares a
los intervalos de confianza. Si la
densidad posterior para8se ha obtenido, podemos construir un intervalo, centrado casi siempre en la media posterior, que contiene lOO(1 - a)por ciento de la
probabilidad a posteriori. Tal intervalo recibe el nombre de intervalo de Bayes
del 100( 1 - a) por ciento parael partimetro desconocido 8.
Si bien en muchos casos la estimaci6n del intervalo de Bayes para
8 sera
bastante similar a un intervalode confianza clsico conel mismo coeficiente de
confianza, la interpretaci6n de los dos es muy diferente.
Un intervalo de confianza
es un intervalo que, antes de que se tome la muestra, incluir%la 8 desconocida
con probabilidad 1 - a.Esto es, el intervalo de confianza
cldsico se relaciona con
la frecuencia relativa deun intervalo queincluye a 8. Por otra parte, un intervalo
de Bayes es un intervalo que contiene lOO(1 - a) por ciento de la probabilidad
a posteriori para 8. Puesto que la densidad de probabilidad a posteriori mide el
grado de creencia acerca de 8 dados los resultados de la muestra, el intervalo
de Bayes brinda un grado de creencia subjetivo acerca de
8 en lugar de una
interpretaci6n de frecuencia. La estimaci6n
del intervalo de Bayes es afectada
por los resultados de la muestra, pero
no determinada completamente por
ellos.
. .
766
P ( H o }= 3133
P { p < 2.0)
2.02.40
@ (- 3 9 )
P{
H I=}.1867
P ( H,)
~-
P (H I )
3133
- 4.36
"
.I867
2.0
N,:p
2.0
19-6 EJERCICIOS
767
exactamente, sino miis bien que p es muy cercana a 2.0, podramos modificar la
hip6tesis a, digamos,
H,,: 1.9 I p
I 2.1
19-5 Resumen
Este captulo ha presentado la teora de la decisibn estadstica y ha tratado en
forma breve las relaciones entre
la teora de decisiones,la inferencia bayesianay
la estadstica clhsica. Un aspecto importante de la teora de decisiones es la
incorporaci6n de una funci6n de perdida
en el aniilisis. Esto permite al tomador
de decisiones elegir una acci6n que es 6ptima con respectouna criterio especificado.Sepresentarontambienlosconceptosdedistribucionesaprioriya
posteriori. Podemos hacer varias comparaciones interesantes entre
los enfoques
clhsico y bayesiano para la inferencia estadstica. Los metodos de inferencia
cliisica emplean s610 informaci6nde la muestra, en tantoquelosmetodos
bayesianos emplean una mezcla de subjetividad e informaci6n de la muestra a
traves del procedimiento de actualizaci6n que transforma
la distribucibn a priori
en la distribucidn a posteriori.
En efecto, el enfoque bayesiano permite
al analista
una metodologa para introducir de manera formal cualquier informacidn previa
en el problema, en tanto que los procedimientos cllsicos ignoran la informacibn
previa o la tratan de modo informal. Los procedimientos cliisicos requieren que
el analista seleccione valores para las probabilidades de los errores de tipo I y
tipo 11. Si estas probabilidades se seleccionan con cuidado despues de la consideraci6n pertinente delas consecuencias de los dos tipos de errores, entonces
el
marco de referencia
clBsico es razonable.Sin embargo, si se eligen arbitrariamente, entonces hayuna grave falla en la aplicaci6n del enfoque cliisico. El metodo
bayesiano evita esto, en cierta medida.
19-6 Ejercicios
19-1 Sea X una variable aleatoria distribuida normalmente con mediap y varianza o*.
Suponga queo' se conoce y que
p se desconoce. Se supone que la densidad a priori
para p sera normal con mediap,, y ai.Determine la densidad a posteriori parap,
768
y varianza
desconocida a'. Suponga que la densidad a priori para 1 / 0 2 es una distribucidn
gamma conparmetros m + 1 y ma;.Determine la densidada posteriori para 1/0',
dada una muestra aleatoria detamao n de X.
de X.
19-5 Sean X una variable aleatoria de Bernoulli con pariunetro p . Si la densidad a priori
19-14 En un proceso se manufacturan tarjetas de circuitoimpreso. Una muesca delocalizacibn se perfora a una distancia X del agujero de un componente sobre la tarjeta.
La distancia es una variable aleatoriaX N(p, .Ol). La densidad a priori para p es
uniforme entre .98 y 1.20 pulgadas. Una muestra aleatoria detamailo 4 produce el
19-6 EJERCICIOS
769
i.
f(8)
a)
b)
o< 8
<1
19-20 Considere que X sigue la distribucin de Bernoulli con parmetro p . Suponga que
f(p)=bp(l-p)
0 ~
= o casootro en
CAPITULOESTADSTICA
19 TEORA
770
DECISIONES
DE
[ ( a ;P ) = 2
encuentre el estimador de Bayes pdepara n
0 -PI
= 1.
19-21 Una
19-23 Mediante
19-25 Demuestre
i .345ory
.355
Apndice
Tabla I
Distribucibn
acumulativa
de
Poisson
Tabla II
Distribucin
acumulativa
normal
estandar
Tabla 111
Puntos
porcentuales
de
la
distribucin
Tabla IVPuntosporcentualesde
la distribucibn t
Tabla V
Puntos
porcentuales
de
la
distribucin
Diagrama VI
x*
F
CurvasCaractersticasdeoperacin
Valorescrticosparalapruebadesigno
Tabla XI
Valorescrticospara
signo
\ Tabla XI1
Tabla Xlll
lapruebaWilcoxondelrangocon
Escaladesignificacinparalapruebaderangomltiple
de Duncan
Factorespara los diagramasdecontroldecalidad
Tabla XIVFactoresparalmitesdetoleranciabilaterales
Tabla XV
Nmeros
aleatorios
API~NDICE
772
TABLA I
.o1
.O5
999
99
.10
,985
.20
,998
,992
.30
I
I
.999
.50
.60
,878
.963,909 ,938
,996
,999
,999
c =At
.965
,994
.40
.70
.80
.90
1.00
7.10
1.20 1.401.30
,496
1
2
3
4
5
6
7
8
,844
,999
,999
,449
,808
.952
.990
,998
.999
,406
.772
.937
,986
,997
,999
,367
735
,919
.981
,996
,999
.332
,699
.900
,974
,994
,999
,301
,662
.879
,966
,992
,998
1.50
1.60
1.70
1.80
1.90
2.00
2.10
2.20
,223
,808
.182
,493
,757
.906
-970
.992
,165
,462
,730
,891
.963
,989
.149
,433
.703
,874
,955
,986
.I35
1
2
,201
,524
,783
,921
,976
,993
,122
379
.649
,110
,354
622
,819
,927
,975
.272
,626
.857
.956
,989
,997
.246
,591
,833
,946
.985
.996
,999
c =At
,557
3
.934
,981
4
.995
5
998 ,998 .ggg
6
999 .ggg ,999
7
,999 ,999 ,999 .999
8 ,999 ,999
,999
9
10
,406
576
,857
.947
,983
,838
,937
.979
,999
AP~NDICE
773
2.30
,100
1
,330
,596
2
.799
3
4
,916
4 ,943 ,950 ,957
5 .964 .970
6
,990
7
,997
,999
8
,999
9
,999
10
,999
11
12
O
2.40
2.50
2.60
2.70
2.80
2.90
3.00
.O90
,082
,287
,543
,757
,891
.O74
,267
,518
,736
.a77
.O67
.248
.493
.714
.a62
.O60
.231
.469
,691
.a47.a15
.O49
,199
,423
.647
.985
,995
.998
,999
,999
,999
,982
.994
,998
,999
,999
,979
,993
,998
,999
.999
,975
.991
.997
,999
,999
.O55
,214
,445
.669
,831
.925
,971
,990
,996
.999
.999
.999
,999
5.50
6.00
6.50
7.00
.O04
.O26
.o88
,201
,357
,528
.686
,809
,894
,946
,974
,989
,995
,998
,999
.999
,999
,999
.O02
.O17
.O61
.151
.285
,445
.O01
.O00
.O11
.O43
.111
,223
,369
,526
,672
.791
,877
,933
,966
,983
,992
,997
.998
,999
.999
.999
,999
.O07
.O29
,308
,569
.778
.go4
,988
,996
.999
.999
,999
.999 ,999
.916
.966
,988
.996
,998
.999
.999
,999
,320
,536
,725
,857
.934
3.50
4.00
4.50
=At
5.00
.O30
.o18
.o11
.O06
,135
.o91
,238
.433
,628
,785
.E89
,948
,978
,991
,997
,999
,999
.999
,999
.O61
,173
,342
.532
,702
,831
,913
,959
.O40
,124
,265
,440
,615
.762
.E66
,931
.96a
,986
,994
,997
,999
,999
,999
.999
2
3
4
5
6
7
.996
8
9
10
,999
,999
.999
11
12
13
14
15
16
17
18
19
20
,973
.990
,998
,982
,993
.997
,999
,999
,999
,999
,606
,743
,847
,916
,957
.979
,991
.996
,998
,999
,999
,999
,999
O8 1
,172
,300
,449
,598
,729
.030
,901
,946
,973
,987
.994
.997
,999
.999
.999
,999
,999
AP~NDICE
774
TABLA I
7.50
8.00
8.50
9.00
9.50
10.0
15.0
20.0
.O00
.O00
.O04
.O20
.O59
.I32
,241
,378
.524
.661
,776
362
,920
,957
.978
,989
,995
,998
,999
.999
,999
,999
.999
.O03
.O1 3
.O42
.o99
,191
,313
.452
.592
,716
,815
.O00
,001
.O09
.O00
1
2
.O00
.O00
.o00
.O00
.O04
.O14
.O40
.o02
.O00
.O00
.O00
.O00
.O00
.O02
.000
.000
.000
000
.000
.000
000
.000
.002
.005
.o1o
.021
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
,888
,936
,965
.982
,991
.996
.998
.999
,999
,999
.999
.999
.O30
.O74
,149
,256
,385
,523
,652
,763
.848
,909
,948
.972
986
,993
,997
.998
,999
,999
,999
.999
,999
.o0 1
.O06
.o21
.O54
.115
,206
,323
,455
,587
.705
,803
,875
.926
,958
,977
,988
,994
.997
,998
,999
,999
.999
.999
.O88
,164
,268
,391
.521
,645
,751
,836
,898
,940
,966
.982
.991
.995
.998
.999
,999
,999
,999
,999
.O10
.O29
.O67
,130
,220
,332
,457
.583
,696
.791
,864
,916
,951
,972
,985
,992
,996
,998
,999
,999
,999
,999
,999
.O07
.O18
.O37
.O69
,118
,184
.267
.363
.465
,568
,664
748
,819
,875
,917
,946
,967
.980
,988
,993
,996
.998
,999
,999
999
,999
,999
999
.039
.066
104
,156
221
29 7
,381
.470
.559
.643
,720
,787
843
,887
,922
.947
,965
,978
.986
,991
,995
.997
,998
___-
aLas entradas enla tablason valores de F(x) = P(C S x) Z = ,Ie;" /c!. Los espacios en blanco debajo
de la ultima entrada en zualquier columna pueden leerse como 1 .O; los espacios en blanco sobre la
primera entrada en cualquier columna pueden leerse como
0.0.
AP~NDICE
77s
.o0
.o1
.o2
.O4
98 .511 97
.515 95 .o
,500O0
,503
99 .507
,555
67 .1
,543 79 ,547 76 551.72
.1
,539
83
.583 17 ,58706
.2
,57926
,590 95 .594 83 .2
,621 72 .625 51 .62930
,633
07 .3
.3
,61791
.659 10 .662 76 .66640
,670
03 .4
.4
,655
42
.69497
,698'47
,705 40 .5
.5
.691 4Q
.70194
.72907
.6
,72575
.6
.732
37 .735 65 ,73891
,761 15 .76424
.7
.758
03
,767 30 ,770 35 .7
,799 54 .8
.79103
,79389
.8
,78814
.79673
.9,81594
,81859
,821 21 .E23 81 .E26 39 .9
B50 83
1 .o
1 .O
,84134.E4375.E4613.E4849
,872
85 1.1
1.1
.E6433,86650,868
64
.E70
76
1.2
.E9251
1.2,884
93,88686
,888 77,89065
1.3
1.3.90320,90490,90658.90824
.90988
,925
06 1.4
1.4,91924,92073.92219,92364
,938
22 1.5
1.5
.93319.93448,93574.93699
1.6
.94950
1.6
.945
20
.946
30
,947.38
.918
45
,959
07 1.7
1.7,95543,95637.957
2
8
,
,95818
1.8
.9671 1
1.8,964
07,964
85
.96562
,96637
,973 81 1.9
,971
1.9
28
.971
93
\
,973
20
.979 32 2.0
78,
,97882
2.0
.97725
.977
,983 82 2.1
.982
14
2.1
.98257
,98300
,98341
.987 45 2.2
2.2
.986
IO
,98645,98679,987
13
2.3
2.3
.989
28
,98956
,989 83 .99010
,99036
.992 66 2.4
,99202
,992 24 .99245
2.4
,991
80
,993 96 .994 13 ,994
30 ,994 46 2.5
2.5
993 79
,99547
.995 73 ,995 85 2.6
.99560
2.6
.99534
,99664
,996 74 ,996
83 .996 93 2.7
2.7
.996
53
,997
52 ,997
2.8
,997
44
60 .997 67 .997 74 2.8
2.9
,998
13
.99819
,998 25 .998 31 ,998 36 2.9
3.0
.99865
,998
69 .998 74 ,998 78 ,998
82 3.0
3.1
.99903
,99906
,999 10 .999 13 ,999 16 3.1
3.2
,999
31
,99934
.999 36 ,999 38 .999 40 3.2
3.3
,99952
.99953
,999 58 3.3
.99955
.99957
,99966
3.4
.999 68 ,99969
,999 70 .999 71 3.4
3.5
,99977
.99978
,99980
3.5
,99978
,99979
3.6
.99984
,99985
,99985
.99986
.999 86 3.6
3.7
,99989
,99990
,99991
3.7
,99990
,99990
3.8
,999
93
.999 94 3.8
,999
93 ,999
93 ,99994
3.9
,99995
,99995
,99996
.999
96 3.9
,99996
.O
::;:i:J
.O3
776
AP~NDICE
TABLA II
.o
.1
.2
.3
.4
.5
.6
.7
.8
.9
1.o
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
.O5
.O6
,519 94
,559 62
,598 71
,636 83
.673 64
,708 84
.742 15
,773 37
.a02 34
.828 94
,853 14
.8?4 93
:1894,35
:mi 49
.926 47
,939 43
,950 53
.959 94
.967 84
,974 41
,979 82
,984 22
.987 78
,990 61
,992 86
,994 61
,995 98
,997 02
.997 81
.998 41
,998 86
,999 18
,999 42
.999 60
,999 72
.999 8 1
.999 87
,999 91
,999 94
.999 96
,523 92
,563 56
,602 57
.640 58
,677 24
,712 26
.745 37
.776 37
,805 10
,831 47
.a55 43
,876 97
,896 16
,91308
,927 85
,940 62
,951 54
.960 80
,968 56
,975 O0
,980 30
,984 61
,988 o9
,990 86
,993 05
.994 77
,996 O9
,997 11
.997 88
,998 46
.998 89
,999 21
,999 44
.999 6 1
.999 73
.999 81
,999 87
,999 92
,999 94
,999 96
.O7
,527 90
,567 49
,606 42
,644 31
.680 82
,715 66
,748 57
,779 35
,807 85
.a33 97
357 69
.a79 O0
,897 96
,914 65
,929 22
,941 79
,952.54
,961 64
,969 26
.975 58
.980 77
,985 O0
,988 40
.991 11
,993 24
,994 92
,996 21
,997 20
.997 95
,998 51
,998 93
,999 24
,999 46
.999 62
,999 74
.999 82
,999 88
,999 92
,999 95
,999 96
.O8
.o9
,53188
.571 42
,610 26
,648 03
,684 38
,719 04
,751 75
,782 30
,810 57
,836 46
.a59 93
.881 O0
,899 73
,916 21
,930 56
,942 95
,953 52
,962 46
.969 95
,976 15
.98124
,985 37
,988 70
,991 34
,993 43
.995 06
,996 32
,997 28
.998 o1
,998 56
.998 97
,999 26
,999 48
.999 64
.999 75
.999 83
.999 88
699 92
,999 95
,999 97
,535 86
,575 34
.61409
,651 73
.687 93
.722 40
,754 90
,785 23
313 27
,838 91
,862 14
.882 97
,90147
,917 73
,931 89
,944 O8
,954 48
,963 27
.970 62
,976 70
,981 69
,985 74
,988 99
.991 58
.993 61
.995 20
,996 43
,997 36
.998 07
,998 61
.999 O0
,999 29
,999 50
,999 65
,999 76
,999 83
,999 89
.999 92
,999 95
,999 97
.o
.1
.2
.3
.4
.5
.6
.7
.8
.9
1.o
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
AP~NDICE
"
.
"
.
777
"
APCNDICE
778
AP~NDICE
779
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
40
60
120
r
.40
.25
.10
.O5
.O25
.O1
,005
.O025
,325
,289
,277
,271
,267
,265
263
,262
,261
260
260
,259
.259
,258
,258
,258
,257
,257
,257
257
,257
,256
,256
256
,256
,256
,256
,256
,256
,256
,255
,254
,254
,253
1.O00
,816
,765
,741
,727
,718
.711
,706
,703
700
,697
,695
.694
,692
,691
.690
,689
,688
,688
,687
,686
686
,685
,685
,684
,684
,684
,683
,683
,683
,681
,679
677
,674
3.078
1 .E86
1 638
1.533
1.476
1.440
1.415
1.397
1.383
1.372
1 363
1.356
1.350
1 345
1.341
1.337
1.333
1.330
1.328
1.325
1.323
1.321
1.319
1.318
1.316
1.315
1.314
1.313
1.311
1.310
1.303
1.296
1.289
1.282
6.314
2.920
2.353
2.132
2.015
1.943
1 895
1.860
1.833
1.812
1.796
1.782
1.771
1.761
1.753
1.746
1.740
1.734
1.729
1.725
1.721
1.717
1.714
1.711
1.708
1.706
1.703
1.701
1.699
1.697
1.684
1.671
1.658
1.645
12.706
4.303
3.182
2.776
2.571
2.447
2.365
2.306
2.262
2.228
2.201
2.179
2.160
2.ld5
2.131
2.120
2.110
2.101
2.093
2.086
2.080
2.074
2.069
2.064
2.060
2.056
2.052
2.048
2.045
2.042
2.021
2.000
1.980
1.960
31.821
6.965
4.541
3.747
3.365
3.143
2.998
2.896
2.821
2.764
2.718
2.681
2.650
2.624
2.602
2.583
2 567
2.552
2.539
2.528
2.518
2.508
2.500
2.492
2.485
2.479
2.473
2.467
2.462
2.457
2.423
2.390
2.358
2.326
63.657
9.925
5.841
4.604
4 032
3.707
3.499
3.355
3.250
3 169
3.106
3 055
3.012
2 977
2.947
2.921
2.898
2.878
2.861
2.845
2.831
2.819
2.807
2.797
2.787
2.779
2.771
2.763
2.756
2.750
2.704
2.660
2.617
2 576
127.32
14.089
7 453
5.598
4.773
4.317
4.029
3 833
3.690
3.581
3.497
3.428
3.372
3.326
3.286
3.252
3.222
3.197
3.174
3.153
3.135
3 119
3.104
3.091
3.078
3.067
3.057
3.047
3.038
3.030
2.971
2.915
2.860
2.807
.O01
318.31
23.326
10.213
7.173
5.893
5.208
4.785
4.501
4.297
4 144
4.025
3.930
3.852
3 787
3.733
3.686
3.646
3.610
3 579
3.552
3.527
3.505
3.485
3.467
3.450
3.435
3.421
3.408
3 396
3.385
3.307
3.232
3.160
3.090
,0005
636.62
31.598
12.924
8.610
6.869
5.959
5.408
5.041
4.781
4.587
4.437
4.318
4.221
4 140
4.073
4 015
3.965
3.922
3.883
3 850
3.819
3.792
3.767
3.745
3.725
3.707
3 690
3.674
3.659
3.646
3.551
3.460
3 373
3.291
Fuente: Esta tabla se adapt6de Biometrika Tables for Statisticians, Vol. 1, 3a. edici6n, 1966, con
autorizacibn de Biometrika Trustees.
780
>
AP~NDICE
AP~NDICE
8
c
I YC
702
AP~NDICE
%
%?S
N N N N
r.
N N N N N
AP~NDICE
9
U
a
EL
>
<
183
AP~NDICE
AP~NDICE
APENDICE
706
AP~NDICE
707
APENDICE
7aa
11 Curvas CO para diferentes valores den correspondientes ala prueba ji cuadrada de dos
lados en un nivel de significacibn a = .o1
790
AP~NDICE
791
APENDICE
793
AP~NDICE
0.80
r"
C
0.60
m
m
o
o
o
._
pn
0.40
e
o
o 20
O
q) Curvas co Pkra diferentes valores
de n correspondientes ala prueba F de un lado en un
nivel de significacidn a = .05.
794
APENDICE
Fuente: El diagrama VI1 se adapt6 con autorizaci6n de Biometrika Tables for statisticians,
Vol. 2, por E. S. Pearson y H. O. Hartley, Cambridge University Press, Cambridge,1972
AP~NDICE
795
AP~NDICE
796
@(para
a=O.Ol)-l
AP~NDICE
797
Q (para a = 0.01)
APENDICE
798
.%
.70
.S
60
50
40
30
B
S
20
C
.10
0 :;
a l 0 6
u
05
u 0 4
O
a
2
03
o2
n.
70
50
.o 30
1
10
X (paraa=.Oi) +10
30
50
170 150
90 130 110
70 170
90
150130110
1 9 0 C h (Param=
190
1.o0
80
10
60
50
._
(D
40
y1
B
.S
-m
30
20
al
lJ
C
Q
._
O
5
o
8
-0
-a
O
.10
.O8
.O7
.m
05
m 0 4
03
02
.o1
Fuente: Reproducidaconautorizacidn
de ngineeringStatistics,
H.
AP~NDICE
799
.60
.50
.40
.$ .30
m
B
E
.20
m
m
u
C
.10
.O8
.O?
S .o6
D
.O5
.o4
.O3
n
.o2
.o1
2
1
(paran=.Ol)
.o2
.o1
-+- 1
5
3
6
4
7
5
8
6
9
7
10
8
11+
9
h (paran=.05)
10
11
12
13
h, (paraa=.OI)-+1
7
4
8
5
f-
h (paran= .05)
7
8
10
11
12
AP~NDICE
800
h (paraa= .01) + 1
1.o0
.8O
t
70
.60
.50
.40
.o2
.o1
10
801
AP~NDICE
1.o0
.80
.?O
.60I
.50
.40
._
v)
.30
a
.S
.20
U
C
.O
._o
5. .10
p:
m
d
p
P
25
.O8
.O7
.o6
.O5
.O4
.O3
.o2
.o1
2
3
4
5
h (paras= 05) 4 1
6
2
A (para u = .01)
3
4
5
AP~NDICE
802
R%S
2
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
6
7
7
38
38
39
4
9
4
4
4
4
4
5
5
5
5
6
6
6
6
6
7
7
7
10
1 1 17
12
18
26
13
20
27
36
14
21
29
38
49
15 31
22
15
23
32
42
53
65
78
16
24
34
44
55
68
81
96
40
51
63
10
11
12
13
14
15
10
17
26
35
46 58
71
85
99
115
10
18
2X
37
48 60
73
88
103
119
137
1 1 19 28
38
50
63
76
91
106
123
141
160
1 1 20
29
40
52
65
79
94 110
127
145
164
185
12
21
31
42
54
67
82
97
114
131
150
169
12
21
32
43 56
70
84
100
117
135
154
13
22
33
45
58
72
87
103
121
139
13
23
34
46
60
74
90 107
124
77 93 110
1424354862
14
25
3750647995
38 51 6682
15
26
15 27395368
16
28
40 55
16
28
42
17
29
17
803
AP~NDICE
R%,
2
5
15
6
231610
7
32241710
8
4334251711
11 6
2618
9
10
12 6
2719
11
12 6
2820
12
13 7
3021
14 7
13
3122
14
14 7
3222
15
15 8
3323
16
15 8
3424
17
16 8
3625
18
16 8
3726
111
947864503819
2717 9 3
978166523920
2818 9 3
218368534032918 9
22
7055
42291910 3
23
5743301910 3
24
44312010 3
25322011 3
26 2111 3
27
11 4
28
4
14
8 1312
9 1110
4535
56
4737
71 58
493887 74 61
5140
106
63 90 76
53 41
125
10993 79 65
129
11296 81 67
54147
43
5644
171
151
133
70
115
9984
137
119
102
8672
5846 155
122
105
8974
47 140
60
6249
76125
108
92
15
AP~NDICE
804
TABLA X
RX
27
28
29
30
31
32
33
34
35
36
37
38
39
40
O
O
O
0
0
1
1
2
2
3
3
3
4
4
5
5
5
6
6
7
7
7
8
8
9
9
10
10
10
11
11
12
12
13
13
13
14
1
1
1
2
2
2
3
3
4
4
4
5
5
5
6
6
7
7
7
8
8
9
9
9
10
10
11
11
12
12
12
13
0
0
0
0
1
1
1
2
2
2
3
3
3
4
4
4
5
5
6
6
6
7
7
7
8
8
9
9
9
10
10
11
11
805
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
Fuenre: Adaptada
10
.O5
O
2
3
5
8
10
13
17
21
25
30
35
41
47
53
60
67
75
83
91
1O0
110
119
130
140
151
163
175
187
200
213
227
241
256
271
286
302
31 9
336
353
371
389
407
426
446
466
O
2
3
5
8
10
13
17
21
25
29
34
40
46
52
58
65
73
81
89
98
107
116
126
137
147
159
170
182
195
208
221
235
249
264
279
294
310
327
343
361
378
396
41 5
434
.o2
.01
1
3
5
7
9
12
15
19
23
27
32
37
43
49
55
62
69
76
84
92
101
110
120
130
140
151
162
173
185
198
21 1
224
238
252
266
281
296
312
328
345
362
379
397
0
1
3
5
7
9
12
15
19
23
27
32
37
42
48
54
61
68
75
83
91
1O0
1o9
118
128
138
148
159
171
182
194
207
220
233
247
26 1
276
291
307
322
339
355
373
806
AP~NDICE
al
Q)
-mm
o
In
w
4
2
AP~NDICE
807
808
AP~NDICE
TABLA Xlll
Factores para
los lmites
de control
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
3.760
2.394
1.880
1.596
1.410
1.277
1.175
1.O94
1.O28
,973
,925
.884
,848
.816
,788
,762
.738
,717
,697
.679
,662
,647
,632
,619
an > 25: A , = 3/
1.880
1.O23
.729
.577
,483
.419
,373
,337
,308
,285
.266
,249
,235
,223
.212
,203
.194
,187
.180
.173
,167
,162
,157
.153
Diagrama R
Factores para Factores para
la lnea
los lmites
central
de control
1.128
1.693
2.059
2.326
2.534
2.704
2.847
2.970
3.078
3.173
3.258
3.336
3.407
3.472
3.532
3.588
3.640
3.689
3.735
3.778
3.819
3.858
3.895
3.931
O
O
O
O
O
.O76
.136
,184
,223
,256
,284
.308
,329
.348
,364
,379
,392
,404
,414
,425
.434
,443
.452
,459
3.267
2.575
2.282
2.115
2.004
1.924
1 .864
1.816
1.777
1.744
1.716
1.692
1.671
1.652
1.636
1.621
1.608
1 ,596
1.586
1.575
1.566
1.557
1.540
1.541
q,
n = nmero de observaciones en la muestra.
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
AP~NDICE
809
810
AP~NDICE
o
o
AP~NDICE
TABLA XV
Nmeros aleatorios
7914194 62590
646691
81
64791
O1 536
0201 1
15011
10480
93965
53402
891
9827982
30995
85393
46573
25595
22368
24a30
49340
15179
64809
76393
97265
22527
241
30 48360
71341
53537
16376
39440
61
68007856
06243
421
6793093
81
305 49684
78260468
061 21 91
81
83716656
39975
37570
90655
70659
18602
53498
27756
42751
11008
06907
77921
44013
71 194 18738
31O1 6
56420
69994 98872
72905
99562
69014
56869
94595
20922
18876
07972
91
97705463
96301
25331
84378
181
0357740
17453
10281
63661
14342
89579
O81
58
62300
38867
59533
53060
53342
53988
36857
85475
90106
05859
56865
79936
70997
88231
33276
69578
2891 8
521
80
72695
18663
69445
49626
48235
03427
40961
63553
30015
17617
36320
33488
52636
92737 88974
93969
09429
67689 93394 01511
48237
52267
85689
61 129 87529
10365
81
056 97735
47564
13916
O81
7877233
71O48
071 19 97336
49442
92144
60756
16308
51 259 77452
12765
51821
51 085
o1 188
44819
19885
55322
89368
60268
21 382 52404
02368
71585
29852
4618594
31 273 041
94904
54092
33362
01011
23495
14513
831
4998736
2321 6
58586
53916
46369
52162
51851
13602
76988
06691
42698
33787
O9998
97628
07056
04734
59193
90229
O91
72
301
68
14346
91
245 85828
48663
26384
58151
25306
76468
741
0347070
22421
541
6458492
28728
35806
94342
13363
38005
05597
24200
32363
32639
46557
15398
00256
45834
58731
a7308
87637
27001
29334
50001
61280
19731
60952
92420
07351
28834
33062
02488
14778
76797
66566
24878
82651
04839
96423
81 525 72295
86645
81536
89768
46901
20849
68086
26432
20591
29676
61
36298947
32832
84673
66432
40027
39064
57392
00742
45766
63904
37937
44407
26422
44048
25669
04213
05366
71500
22209
25940
39972
26766
641 17 94305
26418
91921
81817
99547
42206
77341
351
26 74087
04711
87917
00582
84637
36086
76222
88072
561
70 86324
69884 62797
00725
40801
08625
27354
26575
18988
55293
95876
65795
69011
65424
67917
48708
18912 82271
88604
29888
25976
57948
35797
05998
28290
12908
30883
18317
73577
83473
39763
99730
55536
04024
86385
29880
27958
30134
91 567 42595
20542
18059
491
27 20044
59931
06115
90999
56349
17955
58727
28168
18845
49618
02304
51 O38 20655
18584
46503
25417
44137
94824
781 71 84610
921
57 89634
82834
09922
61607
14577
56307
35605
81
263 39667
62765
47358
56873
98420
O4880
33362
98427 07523
64270 O1 638
92477
66969
40836
32427
88720
34914
82765
63976
34476
17032
87589
39475
46473
70060
28277
94970
25832
69975
23219
53416
06990
67245
53976
54914
42878
80287
68350 82948
11398
2951 5
40980
76072
58745
07391
25774
22987
80059
39911
52210
83974
90725
65831
29992
38857
83765
55657
50490
64364
67412
33339
31
926 14883
24413
59744
92351
97473
08962 00358
31662
61
64234072
25388
81
249 35648
56891
95012
68379 93526
10592
70765
04542
76463
54328
02349
15664
10493
20492
91 132 21 999 59516
38391
81652
27195
Referencias bibliogrficas
Anderson, V. L., and R. A. McLean (1974), Design of Expenments:A Realistic Approach,
Marcel Dekker, NewYork.
Berrettoni, J. M. (1964), Practical Applications of the Weibull Distribution, Industrial
Quality Control, Vol. 21, No. 2, pp. 71-79.
Bartlett, M. S. (1947), The Use of Transformations, Biometrics, Vol. 3, pp. 39-52.
Belsley, D. A,, E. Kuh, and R. E. Welsch (1980), Regression Diagnostics, John Wiley &
Sons, New York.
Box, G. E. P., and D. R. Cox (1964), An Analysis of Transformations, Journal of the
Royal Statistical Society, B, Vol. 26, pp. 21 1-252.
Cheng, R.C., The Generationsof Gamma Variables with NonintegralShape Parameters,
Applied Statistics, Vol. 26, No. 1 (1977), pp. 71-75.
Cochran, W. G. (1947), Some Consequences When the Assumptions for the Analysis of
Variance Are Not Satisfied, Biometncs, Vol. 3, pp. 22-38.
Cochran, W. G., and G. M. Cox (1957), Experimental Designs, John Wiley & Sons, New
York.
Cumulative Binomial Probability Distribution
(1 9 5 9 , Harvard University Press, Cambridge, Mass.
Cook, R.D. (1 977), Detection of Influential Observations in Linear Regression, Technometria, Vol. 19, pp. 15-18.
Cook, R. D. (1974), Influential Observations in LinearRegression,Journal ofthe
American Statistical Association, Vol. 74, pp. 169-174.
Daniel, C., and F. S. Wood (1980), Fitting Equations to Data, 2nd edition, John Wiley &
Sons, New York.
Davenport, W. B., and W. L. Root (1958), An Introduction tothe Theory ofRandom Signals
and Noise, McGraw-Hill, New York.
Draper, N. R., and W. G. Hunter (1969), Transformations: Some Examples Revisited,
Technometrics, Vol. 1 1 , pp. 23-40.
Draper, N. R., and H. Smith (1 98 l),Applied Regression Analysis, 2nd edition,John Wiley
& Sons, New York.
Duncan, A. J. (1 986), Quality Control and Industrial Statistics, 5th edition, Richard D.
Irwin, Homewood, 111.
Duncan, D. B. (1955), Multiple Range and Multiple F Tests, Biometrics, Vol. 1 1, PP.
1-42. Epstein, B. (1960), Estimation from Life TestData, IRE Transactions on Reliability, Vol. RQC-9.
814
REFERENCIAS BIBLIOGRAFICAS
Feller, W. (1968), An Introduction to Probability Theory and Its Applications, 3rd edition,
John Wiley & Sons, New York.
Furnival, G. M., andR. W. Wilson,Jr. (1974), Regression by LeapsandBounds,
Technometrics, Vol. 16, pp. 499-512.
Hald, A. (1952), Statistical Theory with Engineering Applications, John Wiley & Sons,
New York.
Hocking, R. R. (1976), The Analysis and Selection of Variables in Linear Regression,
Biometrics, Vol. 32, pp. 1-49.
Hocking, R. R., F. M. Speed, and M. J. Lynn (1976). A Class of Biased Estimators in
Linear Regression, Technornetrics, Vol. 18, pp. 425-437.
Hoerl, A. E., and R. W. Kennard (1970a), RidgeRegression:BiasedEstimation
Non-Orthogonal Problems, Technometrics, Vol. 12, pp. 55-67.
for
Hoerl, A. E., and R. W. Kennard (1970b), Ridge Regression: Application to Non-Orthogonal Problems, Technometrics, Vol. 12, pp. 69-82.
Kendall, M. G., and A. Stuart (1963). The Advanced Theory ofStatistics, Hafner Publishing
Company, New York.
Keuls, M. (1952), The Use of the Studentized Range in Connection with an Analysis of
Variance, Euphytica, Vol. 1, p. 112.
Lloyd, D. K., and M. Lipow (1972), Reliability:Management, Methods, andMathematics,
Prentice-Hall, Englewood Cliffs, N.J.
Marquardt, D. W., and R. D. Snee (1975), Ridge Regression in Practice, The American
Statistician, Vol. 29, pp. 3-20.
Molina, E. C. (1942), Poisson S Exponential Binomial Limit, Van Nostrand Reinhold, New
Y ork.
Montgomery, D. C. (1984), Designand Analysis of Experiments, 2nd edition, John Wiley
& Sons, New York.
Montgomery, D. C. (1985),Introduction to Statistical Quality Control, John Wiley
& Sons,
New York.
Montgomery, D. C. and E. H. Peck (1982), Introduction to Linear Regression Analysis,
John Wiley & Sons, New York.
Mood, A. M., F. A. Graybill, and D. C.Boes (1974),Introduction to the Theory of Statistics
3rd edition, McGraw-Hill, New York.
Neter, J., and W. Wasserman (1974), AppliedLinear Statistical Models, Richard D. Irwin,
Homewood, 111.
Newman, D. (1939), The Distribution of the Range in Samples froma Normal Population
Expressed in Terms of an Independent Estimate of Standard Deviation, Biometrika, Vol.
31, p. 20.
Owen, D. B. (1962), Handbook of Statistical Tables, Addison-Wesley Publishing Company, Reading, Mass.
Romig, H. G. (1953), 50-100 Binomial Tables, John Wiley & Sons, New York.
REFERENCIAS BlBLlOGRAFlCAS
81s
Scheffe, H. (1953), A Method for Judging All Contrasts in the Analysis of Variance,
Biometrika, Vol. 40, pp. 87-104.
Snee, R. D. (l977), Validation of Regression Models: Methods and Examples, Technometrics, Vol. 19, No. 4, pp. 41 5-428.
Tucker, H. C. (l962), An Introduction to Probabiliwand Mathematical Statistics, Academic Press, New York.
Tukey, J. W. (1953), The Problem of Multiple Comparisons, unpublished notes, Princeton University.
Tukey, J. W. (1977), Exploratory Data Analysis, Addison-Wesley, Reading, Mass.
United States Department of Defense ( I 957), Military Standard Sampling Procedures and
Tablesforlnspectionby VariablesforPercentDefective
(MIL-STD-414),Government
Printing Office, Washington, D.C.
United States Department of Defense( 1 963), Military Standard Sampling Procedures and
Tables f o r lnspection by Attributes(MIL-STD-IOSD), Government Printing Office, Washington, D.C.
United States Department of Defense(1 965), Life Testing Sampling Proceduresfor Estublished Levels of Reliability and Confidence in Electronic Parts SpeciJication (MIL-STD690A), Government Printing Office, Washington, D.C.
Weibull, W. (1 95 I ) , Statistical Distribution Function of Wide Application, Journal of
Applied Mechanics, Vol. 18, p. 293.
White, J. A,, J. W. Schmidt, C. K. Bennett (1975), Analysis OfQueueingSystems,Academic
Press. New York.
25.693
0.0026
1-9.
S
0.0026
1-21.
1-23. (a) El promedio de la muestra se reducir en 63.
1-5.
660.112
s 2 = 164.726
s2 = 6.875 X
X = 126.875
Ji = 11.107
X = 74.002
S' =
S =
1-25. u =
1-29.
1-31.
Para 1-29, cu
1-33.
X = 22.41, S'
2.38
Captulo 2
21.
2-3.
2-5.
(a) 0.75
(b) 0.18
(a) A n B = { 5 }
(b) A u B = { l , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 1 0 }
(c) A n z = (2,3,4,5}
(d) U = {1,2,3,4,5,6,7,8,9,10}
(e) A n ( B U C ) = (1,2,5,6,7,8,9,10}
Y'= { t l , t , ) , t , E R , t 2 E R : t , 2 O, t , 2 O}
A = { ( t l , t , ) , t , E R , t 2 E R : t , 2 O, t , 2 O , ( t , + f2)/2 I
0.15)
B = { ( t l ,t , ) : t , E R , 1, E R : t , 2 O, t2 2 O,Mx(t,, t z ) I
O.lj}
C = { ( t i , t 2 ) : ti E R , t 2 E R : t , 2 O, t2 2 O, It, - t21 I
0.06)
2-7.
Y'=
2-15.
P Aceptar p') =
10 - x
1
x=o
2-17.
2-21.
(a)
2-23.
R ,=
~ 11- (.2)31 . [I - (.1121. (.9) A 0.884
2-25.
( ;)( f )
Siberia
P(FIU)
0.3
25 maneras (b)
U
Urd
P(SIF) =
(0.6)(0.5)
(0.6)(0.5) + (0.4)(0.3)
0.714
P( PIS) = 0.5
010
1
2-21. ___
m-1
1
1 m-1
. - + - . -=
m
m2-m+1
m'(m-1)
2-29. P mujeresp') 0.03226
2-31. 1/4
(365)( 364) . . . (365 - n + 1)
2-35. P ( B ) =
365"
n 20 10
i - 2241 23 22
P ( B ) .117 ,411
2-37. 8!
40320
.444
25
30
I
I
40
2-39. 0.441
Capltulo 3
3-1.
R,
(O, 1,2,3,4}, P,(X = O) 0.7187,
Px(x = 1) A 0.2555, Px(x = 2)0.0250,
Px(x = 3) 0.0007, Px(x = 4) = O.oo00
c = 1, p = 1, o* = 1
3-5. (a) S
3-3.
3-7. (a), (b)
3-9. P( X I
29) = 0.978
3-11. (a) k = i
(b) p = 2, a 2 = 4
(c) &(x) = o; x < o
= x2/8; o I
x <2
=:+:
(b) No.
X2
4X""fj
;21x<4
2
=1;x24
(b) p
= 2, u* =
(c) p> = 3
(d) m
3-23. F;,= 1 - e - ( X 2 / * r Z ) ; x 2 0
=o;x<o
3-25. k = 1, p 1
Capitulo 4
4-1.
(a)
O
0.3 20
80
en otro caso
P Y b )
0.6
0.1
0.0
(b) E ( Y ) = 14
V ( Y ) = 564
3
-
(c) Si
50
60
.994 .970
819
4-7.
(a) 0.221
(b) $155.80
f i ( r ) = e-'; t = O
= O; en otro caso
93.8 c/gal.
4-9.
(a) f v ( y ) =
4-3.
4-5.
$(
-(1/2)
f)
. e-[(.v/2)1/2~;y
>O
= 0;
en otro caso
(b) /,,(u) = 2ue-"'; u z O
= O; en otro caso
u>O
(c) fV(u) =
= O; en otro caso
4-11. S = (5/3) x 106
4-13. / ) , ( y ) = :(S - y)-1/2;oI y I 3
= O; en otro caso
6
4-15.
4- 17.
4-19.
4-21.
4-23.
MA^)
x-
(:)efx
E( X ) = &(O) = ;
V( X ) = M t ( 0 ) - [M$(0)]2 =
E ( Y ) = 1, V ( Y ) = 1
E( X ) = 6.16, V( X ) = 0.027
M , ( t ) = (1 - r/2)-2
E ( X ) = M$(O) = 1
V( X) = M t ( 0 ) - [ M$(0)]2 = $
X bntinua
F,(x) estrictamente
creciente
Let Y = F , ( X ) so & ( y ) = P ( F , ( X ) I y )
= P ( X S F,"(y) = F,(&-yY)) = y
so / y ( y ) = F)!(Y) = 1; o S y I 1
O; en otro caso
M,(r) =
$ e r + :e2' + :e3'
E( X ) = M$(O) = ;
V( X ) = M t ( 0 ) - ( ;)2 = 2
Capitulo S
I o 1
P , . ( y ) 20/50
(b)
P,,,(,Y) 11/27
(e)
---
"
"
1/50
3 2. 4
1
4/27
8/27
P ~ I ~ (11/20
x)
2/20
-"
1/27
3
4/20
4
1/20
3/27
5
1/20
1/20
-.
820
5-3.
5-5.
(a) k = 1
(b) /X,(X~)= &; O I x1 I 100
= O; en otro caso
/X,(X,) = &; o x2 I 10
= O; en otro caso
(a) $
-(b)
(c) fw(w) = 2w;o 5 w 5 1
= O; en otro caso
5-7. y
5-9. E( X1IX2)= ; E(X*lx,) = 5
5-15. E ( Y ) = 80, V ( Y ) = 36
5-19. p = !j
5-21. X y Y no son
independientes.
p = -0.135
2
5-23. (a) fX(x) =
-1 < x < + I
-43;
n
;m;
O; en otro caso
4
fy(y)=
-1 < y < + l
= 0; en otro caso
1
(b) fXlr(X)= -;
<x<
=
/q + m
2 { i 7
= O; en otro caso
O en otro caso
2
+ 3y
;O<y<l
(b) E ( X ) = &
(c) E ( Y ) = &
3(1 + 2 Y )
5-29. (a) k = (n - l)(n - 2)
(b) F(x, y ) = 1 - (1 + x)2-" - (1 y ) 2 - " (1 + x + y ) Z - " ; x > o, y > o
5-30. (a) Independiente. (b) No independiente.
(c)
No independiente.
=
(a)
(b) 1
5-35. (a) F,(z) = FX[(z - n)/b]
(b) F'(z) = 1 - F X ( l / z )
(c) M z ) = Fx(ez)
(4 W z )=F x ( ~ z )
5-33.
Capitulo 6
O
1
2
3
4
en otro caso
63.
(1 - PI4
4P(l - P I 3
6P2U - PI2
4 P V - P)'
P4
O
Suponiendoindependencia
P( W 2 4) = 1 - (.5)12
w-o
65.
P( X > 2) = 1 -
2
x-o
( 5,0)(.02)x(.98)50-x= 0.078
( ty')0.927
A
a21
P(3
0.98
69. P ( X = 5) A 0.0407
1
l + q
6-13. E( X) = Mk(0) = -, E( X2) = M;'(O)
P
P2
1
4
E ( X ) = -, u;= E ( X 2 ) - ( E ( X ) ) 2 = p2
6-7.
I0.03) --I
611. p = 0.8
36)';0.0083
6-17. P( X < 4) = 0.896
E(X)=
V ( X )= f
6-21. p(0,0,3) A 0.118
6-23.p(4,1,3,2)
P( X 5 2) --I 0.98Aprox.binomial
: P ( X I 2) b 0.97
P( X r 1) h 0.95
Aprox.binomial: * n = 9
(25)x
P ( X < 10) = (1.3888 X lo-")
- 6-31. P ( X > 5) 0.215
615. P( X
6-19.
'
6-25.
6-27.
6-29.
y,
0.005
x-o
c =
x!
30.
30"
X!
P( X
2)
0.0047
Capitulo 7
7-1.
7-3.
7-5.
&, 5
f y ( y ) = :;S < y < 9
= O; en otro caso
E ( X ) = Mk(0) = (/? + a)/2
V( X ) = M;'(O) - [M4(0)]2= (B - 4 / 1 2
7-7.
Y<l
11y<2
21y<3
31y<4
y I4
&(Y)
O
0.3
0.5
0.9
1.0
a22
7-31.
1 - eK1 A 0.63
7-35.
(a) = 0.22,
7-33.
il:
0.24
7-37.
(b) 4800
0.35273
Captulo S
8-1.
(a) 0.47725
8-3.
(e) 0.12140
(a) c = 1.56
(a) 0.97725
8-5.
8-7.
8-13.
8-15.
8-17.
8-23.
&B.
(b) 0.6827
(c) 0.95053
(d) 0.975
(f) 0.94853
(g) 0.91465
(h) 0.9898
(b) c = 1.96
(c) c = 2.57
(d) c = -1.645
(b) 0.50
(c) 0.66869
(d) 0.69146
(e) 0.95
30.854:
8-9.
2376.63 fc
(a) 0.0455
(b) 0.0730
0.30854
(c)
(d) 0.30854
B si A'" cuesta < .1368
p =7
8-19. (a) 0.6687
@) 7.84
(c) 6.018
0.616
8-25. 0.00714
8-27. 0.276,
en p = 12.0
(a) 0.552
(b) 0.058
(c) 0.702
(d) 0.09
8-30.
n = 139
8-41. 0.9788
8-37.
8-36. 2497.24
8-42. 0.4681
MED
e$', MODO
= eZ5
Capitulo 9
5
c (x,
- coz
1-1
9-3.
f(X1,
9-9.
El error esthndar de
9-11.
N(0,l)
x2,xj, x4) = 1
x'-.?es
9-13. se( 8) =
+= 0.47
30
,se( 8) =-4
9-15. p = u, u' = 2u
9-17.
u' =
2n2( m + n - 2)
m[n - 22(n - 4)]
para n > 4
9-23. (a)
9-25. (a)
2.73
1.63
Captulo 10
10-1.
10-3.
(b) 11.34
@) 2.85
(c) 34.17
(c) 0.241
(d) 20.48
(d) 0.588
023
i-1
10-23.
Xcl,
- .338 I
, 0 0 4
Io2 I,0157
10-53. .ll
Iof/.,
10-39. 13
pl - p2I .438
1.1092
I.86
10-55. 990
10-59.
10-63.
-3.1529 I pl - p2 I.1529
-1.9015 I p , - ps I.9015
,1775 I pz - p , I2.1775
10-61.
(c) u2 2 2460.62
5 5.365
10-57. 16577
Capitulo I1
11-1.
11-3.
11-7.
11-9.
11-13.
11-15.
11-19.
11-21.
11-23.
11-25.
11-27.
11-29.
11-33.
824
1 =
2
11-49.
11-57.
{z
11-41. Z,
11-47. (a)
0 x 2
xi = 4.724,noserechazaH,.
xi = 27.011, se rechaza H,.
xi = 2.915, no se
rechaza&
x i = ,0331,no se rechaza
11-53.
11-59.
Capltulo 12
12-1.
(a) F,
12-3.
(a) F, = 12.73
14.76
(b) 308
(b) Lasmedias
1 y 3nodifieren.
i1
= 39.1875, iz
= 224.4315, ?, = 1.9375, i 4
F,
12-5.
(a)
12-7.
(a) F,
12-9.
(a)
12-11. n
2.62
(b) ji = 2.70,
= 4.01
-265.5625
.01, iz
= -.18,
(b) Lamedia3difiere.(c)
F, = 14.42
SS,>
(b) La puntadeltipo
?3 =
-.02, f4
4 difiere.
12-15. (a) j
i = 20.47,
.33, F2 = 1.73, f3 = - 2 b l
(b) i,
- t2 = 1.40
Captulo 13
13-1.
DF
MS
5,341.86
7.912
Tipos material 10,683.72
2 28.97
39,118.7219,558.36
Temperatura
2,403.44
3.56
4
Interaccin
9,613.78
615.2127
Error
18,230.75
Total
11,646.97 35
Fuente
SS
Fo
42.88
13-3.
13-7.
Fuente
Tipo de vidrio
Tipo de fsforo
Interaccin
Error
Total
p,
p2 2 16.21
SS
14450.00
466.66
933.33
44.45
133.34
633.33
16150.00
13-5.
DF
1
2
3
11
Ningn cambioenlasconclusiones
MS
4,
14450.00
251.00
8.1
.I1
57.57
17
.O5
825
13-9.
Fuente
C
10.62
55.39
26.50
4.17
F
CF
13-15. Fuente
DE
SS
F,
MS
A
B
C
D
E
AB
AC
AD
AE
BC
BD
BE
CD
CE
DE
Bloque I Bloque 2
a
b
(1)
ab
ac
bc
abc
(b) I,
1,
I,
I,
I, =
Z5-'
,238
- .16
- ,043
,0867
- ,242
D = ABC
IAB
- .O24
IAc = ,0042
I,,
- .O26
I,, = - ,026
I,, = .O59
.O42
.O24
.1575
ICE = - ,029
I,, = ,036
I,,
I,,
I,,
'
I, = B t A C D
I , = C + ABD
I D = D + ABC
--
"
I
"
I,, = A C t BD
I,, = A D t BC
826
D = ABC
190
(1)
b
ab
174
181
183
177
181
188
173
c
-
UC
+
+
bc
abc
-6.25
= .75
C = -2.25
I,,
IAc
I,,
- .25
= .75
.75
= -9.25
(a)
(c)
14-7.
RZ = 81.59%
(a)
(c)
(e)
14-11. (a)
(b)
14-9.
+ 9.208364~
- 6.3378
= 77.7895
&,
(d)
+ 11.9634~
(a) 3 = 2.646
2.068 5
+ 2548x, + 3 . 5 4 9 ~ ~
(b) F,
637.19
I 5.03
P3 = O,
,f
= 1.789
15-19.
6,
= ,862,
i4 = ,714
a27
15-21. VIF,
VIF,
1.16713
Capitulo 16
161.
R =2
165. R = 2
16-9.
1615. IZO[= .16
1617. h = 4.835
Capitulo 17
17-1.
(a) $ = 34.32,
x = 5.68
(b) PCR,
85
16-13. R , = 80
1.228
(c) .205%
17-5.
D
17-7. El proceso no esta bajo control. 17-11. ,1587, n = 6 o 7
17-13. Lmites revisados: LC = 8.55, LCS = 17.32, LCI = O.
17-17. LCS = 4.378, LCS
,282
LCS- = 16.485,,434
= .5826, B
.o039
17-23. LEI
P,p(l - n / N )
17-25. 24.32 f .O642
17-27. (a) R(60) = ,0105
(b) 13.16
17-29. .98104
17-31. .84,.85
17-33. (a) 3842
(b) [913.63, m)
17-15.
17-19.
Capitulo 18
18-1.
(a) = 0.088
(b) L
p = [(l-p)
=
18-7.
(a) P
[
=
2, L,
1.33
(c) W = 1 hr
(l
1/2
1/21/21
I -
o
1
O
1-p
1-p
A = [ 1 O O O]
(c) p = 4 = :*p, =p,
=p3 =p4 =:
p=:,q=:3p,=p2=p3=p4=:
(b) 8 3 (c)
( 4 0.03
(e) 0.10
(a) 0.555
(b) 56.378 min
(c) 244.18 min
18-13. (a) p, = [( i/p)/!] . po; j = o, 1,2,. . . , S
= O; en otro caso
1
Po =
18-9.
18-11.
(a)
(b) S = 6, p = 0.46
(c) p6 = 0.354
(d) De41.6% a 8.33%
(e) p = 4.17, p6 = 0.377
Capitulo 19
(f)
a28
19-3.
19-5.
,i.. $1
19-7.
P=
19-9.
(1/u2) = [m
19-11.
j3 ( U
Z x , = 6270,
c _
19-15.
19-19.
19-23.
+ E(4. - p ) 2
+ 1 + (n/2)l/(mu: + X(x - p ) 2
+ Xq.)/(a + b + TZ) 19-13. /l
= 4.708
.O00323
(a) f(61xl) = 2x/tI2(2 - 2 x )
(b) 8' = $
P ( p < 10) = .7224. La hip6tesis nula es improbable.
=
~NDICE
Anlisis de regresin:
estimacin de pendiente e interseccin,
526-527
Aniilisis de varianza:
clasificacin bidireccional, 459
modelo deefectos aleatorios, 468
modelo de efectos fijos, 455
modelo mixto, 470
clasificacin multidireccional, 472
clasificacin unidireccionat, 411-415
modelo de efcctosaleatorios, 430-435
modelo de cfectos fijos, 41 1-415
contrastes ortogonales, 424
potencia de, 443
prueba de intervalo milltiple de Duncan,
427
830
para prueba:
igualdad de medias de dos
distribuciones normales, a$y o
conocidas, 785-786
igualdad de medias de dos
distribuciones normales, o: y o:
desconocidas, 787-788
igualdad de varianzas de dos
distribuciones normales, 692-693
media de la distribucin normal, a2
conocida, 785-786
media de la distribucin normal, o*
desconocida, 787-788
varianza de la distribucin normal,
789-790
Desigualdad de Chebyshev, 92-94
Desigualdad de Cramr Rao, 288
Desviacin estndar de variable aleatoria,
89
Diagrama de rbol, 2 1
Diagrama de caja, 23
Diagrama de concentracin de defectos,
689
Diagrama de dispersin, 528
Diagrama de Pareto, 8,668, 688
Diagrama p para fraccin de defectos, 680
Diagramas c para defectos, 683
Diagramas de control
diagrama c, 683
diagrama p , 680
diagrama R, 670
diagrama u, 685
diagrama X, 67 1
Diagramas de Venn, 37
Diagramas R,584-585
Diseos de bloque aleatorios, 435
Distribucin anterior, 758
Distribucin beta, 222
Distribucin binomial, 83, 176
aproximacin normal para, 241
propiedades de, 176-182
valor esperado de la,176
varianza de, 177
Distribucin de Bcrnoulli, 174
Distribucin de Pascal, 185
esperanza de, 185
varianza de, 185
Distribucin de Poisson, 82, 189
propiedad reproductiva de, 191
valor esperado de, 191
iNDlCE
iNDlCE
831
ergdico, 729
recurrente positivo, 728
recurrente, 727
transitorio, 727
Estimacin de capacidad de procesos, 676
Estimacin de parmetros:
confiabilidad, 712
eficiencia relativa, 287
estimador consistente, 289
estimador de Bayes, 760
estimador de probabilidad mxima, 290
estimador eficiente, 286
estimador insesgado de varianza
minima, 287
estimador insesgado, 284
mtodo de momentos, 293
mnimos cuadrados, 419,527
Estimaciones de probabilidad mxima,
290-293
Bernoulli, 290
normal, 291
uniforme, 292
funcin de probabilidad para, 290
para parmetros de distribuciones:
propiedades, 293
Estimador de Bayes, 760
Estimador de intervalo de Bayes, 764
Eventos equivalentes, 75, 99
Eventos independientes, 59
Eventos mutuamentc excluyentes, 42
Eventos mutuamente independientes, 61
Eventos, 42
complementarios (complemento de un
conjunto), 42
equivalentes, 75, 99
independientes, 59
mutuamente excluyentes, 42
Experimento factorial, 454
Experimento, idealizado, 41
Experimentos de factoriales fraccionarios,
504
Experimentos independientes, 62
Factores de inflacin de la varianza, 584
Frmulas del tamao de la muestra, 300,
303,317,348,374,378
Frccuencia relativa,44
Funcin caractcrstica, 116
Funcin de decisiones, 752
Funcitin de densidad de probabilidad
marginal, 13 1
832
Funcin de densidad de probabilidad,
84
Funcin de distribucin acumulativa
conjunta, 150
Funcin de distribucin acumulativa, 77
grfica de, 78
propiedades de, 79
y la funcin de densidad de
probabilidad, 84
Funcin de distribucin de probabilidad
conjunta, 125
Funcin de distribucin, vase Funcin de
distribucin acumulativa
Funcin de prdida, 752
Funcin de probabilidad (ley de
probabilidades), 8 1
Funcin de riesgo, 700
Funcin de similitud, 290
Funcin gamma, 2 1 1
Funcin generadora de acumulantes, 123
Funcin generadora de momento, 114-1 18
para distribuciones:
Bernoulli, 174
binomial negativa, 186
binomial, 116, 178
exponencial, 209
gamma, 213
geomtrica, 184
normal, 228
Pascal, 185
Poisson, 191
uniforme, 204
para l a funcin lineal de una variable
aleatoria, 161
para sumas de variables aleatorias
independientes, 161
unicidad, propiedad de, 116
Funciones dc variables aleatorias, 101-107
caso bidimensional, 152
caso continuo, 104
caso discreto, LO1
valor esperado de, 107-1 11
Funciones estimables, 420
~NDICE
alternativa, 335
nula, 335
Histograma, 5
Intensidad de transicin, 732
Interaccin en experimentos fraccionales,
455
Intervalo de confianza, 296
aproximado, 320-32 1
de dos lados, 262
para diferencias:
de dos medias, de dos distribuciones
normales, desconocidas e iguales
y a:, 307
de dos medias de dos distribuciones
normales, desconocidas y
desiguales ff y o:,309
de dos medias, de dos distribuciones,
conocidas a: y a:, 301
de dos proporciones, 3 18
para la pendiente y la interseccin en
una regresin lineal simple, 537
para la varianza de una distribucin
normal, 3 12
para media de tratamiento en el anlisis
de varianza, 420
para medias:
298
de distribucin conocida o*,
de distribucin normal, desconocida
0 2 ,304
de un lado, 297
para observaciones de pares, 3 10
para razn de varianzas de dos
distribuciones normales, 314
para una lnea de regresin lineal
simple, 536
para una proporcin, 3 16
relacidn con la prueba de significacin,
349
simultcneo, 321
Intervalos de prcdiccin, 540
CJ:
Mximo dc muestra, 17
distribucibn de, 279
833
~NDICE
Media de muestra, 10
Media de variable aleatoria, 87
Mediana de una muestra, 11, 20
Medias cuadradas esperadas:
clasificacin bidireccional
modelo deefectos aleatorios, 468
modelos de efectosfijos, 461
modelos mixtos, 470
clasificacin unidireccional;
modelo de efectos aleatorios, 452
modelo deefectos fijos, 415
Mtodos Bayesianos, 758-760
Mtodos de enumeracin, 50
Mnimo deuna muestra, 17
Modelos de lneas de espera:
consideraciones cn, 739
otros modelos, 746
servidor mtltiple, 744
servidor tnico bkico, 740
servidor tnico con lnea de espera
limitada, 743
Modo dc muestra, 12,20
Momento dc una variablc aleatoria, 92
Muestra aleatoria dc variable aleatoria,
263
gcneracin dc muestra aleatoria, 264
Muestra dc juicio, 264
Muestra:
dcsviaci6n estandar de, 16
maximn dc la, 17
mcdia dc la, 10, 19
mediana dc la, 11, 20
minimo de la, 17
modo de la, 17, 12
rango dc la, 17
varianza de la, 13, 18
Muestreo de aceptacibn, 692
inspeccicin rectificable, 693
inspeccin sin rectificacin, 693
plan de muestrco doble, 696
plan de mucstrco militar estndar, 696
plan dc muestrco mtltiple, 696
plan de muestrco secucncial, 696
plan de mucstreo tnico, 693
por atributos, 693
Multicolinearidad, 602
Nivel de calid;lcl aceptable (NCA), 693
Nivcl dc signilicacinn, 337
I
_
"
"
"
c
..
"--"--"-
- ,- .... ,._.
"
834
iNDlCE
de dosdistribuciones normales, o: y
6 desconocidas y desiguales, 360
de dos distribuciones, 0: y o f
conocidas, 350
en regresin lineal simple,46 1
mtodos Bayesianos, 765
observaciones por pares, 363
sobre las varianzas de la distribucin
normal, 366-373
sobre proporciones, 373
Punto elcgido alazar en un intervalo, 205
:,
RCP k, 680
RCP, 678
Redundancia, 706
Regin crtica, 336
Regresin de la media,143
Regresin escalonada, 539
Relacin de definicin, 505
Replicas, 410
Residuos, 421, 440,466, 541
Riesgo del consumidor, 694
Riesgo del productor, 693
Riesgo, 752
Servidor nico con longitud de lnea de
espera limitada, 743
Servidor nico en lnea de espera, 740
Servidores mltiplcs con lnea de espera
ilimitada, 744
Seudnimos, 506
Suma de variables aleatorias
independientes, 159
distribucih, 237
valor esperado de, 158
varianza de, 160
Tabla de contingencia, prueba de
indepcndencia en r X c, 390-394
Tasa de falla, 699
Tendencia central, 87
Teorema central.del lmite, 237
Teorema de aditividad de Ji cuadrada, 268
Teorema de Bayes, 64
Teorema deCochran, 4 1 5
Teorcma demultiplicacin de la
probabilidad, 58
Teora de decisiones, 751
Teora de lneas de espera, 636