Está en la página 1de 752
\ —_—— ‘ Oa eee PROBABILIDAD| | yi | | ESPADISTICA\| | PARA INGENIEROS SEXTA EDICION \ We ‘ \/ WALPOLE 8 mee . MYE RS ao we Ronald E. Walpole Probabilidad y estadistica para ingenieros SEXTA EDICION TRADUCCION: Ricardo Cruz Traductor Profesional REVISION TECNICA: Juan Antonio Torre Marine Ingeniero Mecanico Electricista Universidad Ananuac $64» Chile + Beuador Rofco » Uruguay *Venezeels ‘Tilo, edico Potbiidad yestasice paca Ingeies, 6, e PRENTICE-HALL HISPANOAMERICANA, S.A Mca 199 Fort: 19 we 182 ELICION BX ESPANOL 10K: PABLO EDUARDO ROIG VAZQUEZ, SUPERVISOR DF TRADUCCION, JONGE BONILLA TALAVERA SUPERVISCR DF EDICION OSCAR AVALOS SALCEDO. EDICION E INGLES: Esher dirsctor, Tim Bie Edtorin chet. Jevome Grawt Eada asostnt, Mindy MeCtard Exccuive mano eso, Ktfen Schigparell ng elon, Lind Dbanoy Bete Nichola Remarc wishin VP preition monotactring, David W. Rison ‘asaser, rads Paci Cover designer, layne Conte Marketing manages. Meily Mares Marketing ssisiant, Jenifer Pa Compasitor, Prepare Ine/Emileomp srl WALPOLE: PROBABILIDAD ¥ ESTADISTICA PARE INGENIEROS, be ‘radveido de a sexta etctn en mls eI obras Prababilty an Statises For Eagnces and Scents. Alright reserved. Autonet taste fo Engh ngage eiton piste 9 Pence Hl. In. Anon Smtr compan Teo os ders sean. Tadcoin stra cin cn ins public poe Pentel Ts. ‘Sion & Ser Comp, Allright reserved. No pa of his bok may be reoved oe taniitedin any fom aby ay es Stet meta nclan poucopyng. ego emt se an ee System wthnt pertodon in ing rr he poe Prd cpl tl opal et, prcugelernaivo mds an pe isd edo Deectoswsratin © 199 rpc primeacin en pt PRENTICE-WAII nISeANOANIERICANA Sh Alliccmclco Nim 501 Piso Colts Ao S059, Naueapan de jure, Edo, de Mesicn ISHN mm 72446 lms ina na de eta ita Ni 152 fil Ehah Langage aon Past by rene a, Me ‘Sinn & Sater Company Capyraht ©1958 (PRINTED INMEXICO , Contenido Prefacio ix 1 Introduccion a la estadistica y al andlisis de datos 1 Repaso 1 El papel de la probabilidad 2 Medidas de posicion: media de una muestra 4 Medidas de variabilidad 5 Datos discretos y continuos 6 Modelado estadistico, inspeccion cientifica y diagnosticos graficos 7 Boeene 2 Probabilidad 9 24 Espacio muestral 10 2.2 Eventos 13 2.2 Conteo de puntos de la muestra 19 24 Probabilidad de un evento 27 2.5 Reglas aditivas 30 26 Probabilidad condicional 35 2.7 Rieglas multiplicativas 38 28 Reglade Bayes 44 Ejercicios de repaso 49 iv Contnito 3 Variables aleatorias y distribuciones de probabilidad 51 aa a2 23 a4 a5 Concopto de variable aleatoria 51 Distribuciones discietas de probabilidad 53 Distribuciones cortinuas dk -ontinvas de propabilidad 58 Distibuciones empiricas 63 Distribuciones de probabiidad conjunta 69 Ejorcicios de repaso 62 4 Esperanza matematica 94 aa 42 43 aa Madia de una variable algatorio. 84 Varianzay covarianza $2 Madias y varianzas de combinaciones lineales de variables aleatorias 101 Teorama de Chebyshev 108 Ejercicios de repaso 112 5 Algunas distribuciones de probabilidad discreta_ 114 Introduccién 114 Distribucisn uniforme diserata 114 Distribucionas binomial y multinomial 116 Distribucisn hipergeometriea 125 Distribucionas binomial negativa y geométrica 132 Distribucisn de Poisson y proceso de Peiston 135 Ejercicios de repaco 141 6 Algunas distribuciones continuas de probabilidad 143 61 62 ribucién de probabilidad continue 143 rabueidn normal 145 os bajo fa curva normal 148 ‘Aplicaciones de Ia distibucién normal 163 ‘Aproximacien normal ala binomial 16) sibucionos gamma y exponencial 166 ‘Aplicaciones de las distribuciones exponencial y gamma 170 Distribueién ji cuadrada 172 Distribucién logaritmica normal 173 Distribucién de Weibull 174 Ejercicios de repaso 178 7 Funciones de variables aleatorias 180 ma 72 13 Iniroduccién 18 Transformaciones de variables 180 ‘Momentos y funciones goneradoras de mamentos 189 Contenido ov 8 Distribuciones fundamentales de muestreo y descripciones de datos 198 82 Agunos sess portato: 201 3.3 Presentaconas de datos y melosos grdfecs 84 — Distribuciones muestrales 215 = ae 85 Disweicines uestts de modiss 217 84 Ditton mucsta de ae 87 Disrmucten 238 88 Discten 252 Bjtclos de reaso 237 9 Problemas de estimacion de una y dos muestras 238 9.1 Introduccién 238 9.2 Inferencia asiadistics 238 9.3 Métodos clasicos de estimacion 239 9.4 Una sola muestra: estimacien dela madia 249 95 Error esténder de una estimacisn puntuel 240 8.6 Limites de tolerancia 249 9.7 Dot musetras: estimacién de Ia diferencia entre dos medies 253 9.8 Obsoraciones pareades 259 9.8 Una sola muestra: estimacién de una proporcién 268 9.10 Dos muestras: estimacion de la diferencia entre dos proporciones 268 9.11 Una sola muestra: estimation de la varianza. 271 3.12 Dos muestras: estimacion de la razon de dos varianzes 273, 9.13 Metodos bayesianos de estimacion. 275 9.14 Estimacion de prooabilided maxima 282 Ejercicios de repaso 237 10 Pruebas de hipotesis de una y dos muestras 290 10:1 Hipdtesis estadisticas: conceptos generales 290 102 Prusba de una hipotesis estadistica 292 103 Prusbas de una y dos coles 300 104 Uso de valores Para la toma de decisiones 302 105 Una sola muestra: pruebas con respecto a une sola media (varianza eonocida) 306 108 Relacién con la estimacion del intervalo de confianza 309 107 Una sole muestra: pruebas sobre una sola media (varianza desconocida) 310 108 Dos muestras: pruebas sobre dos medias 313 109. Eleccién del tamafo de la muestra para probar medias 318 10.10 Métodos araficos para comparar medias 323 10.11 Una muestra: prueba sobre una sola proporcién 330, 10.12 Dos muestras: pruebas sobre dos proporciones 333, 10.13 Pruebas reterentes a varianzas de una y dos muestras 336 Vi Conenian 1014 1018, 1016 1017 1018 Prueba de la bondad de aiuste 240 Prueba de independencia (datos catagbricos) 944 Prueba de homogensidad 347 Prueba para varias proporciones 348 Estudio de dos muestras 360 Ejetcicios de repaso 355 11 Regresion lineal simple y correlacién 359 ma mz 13 m4 15 16 1) na 19 11.90 re Introduccién s la regresién lineal 358 Regresion lincal simple 361 Propiedados do los estimadores de minimos cuadredos 365 Inferencias acorca de los coelicientes de regresion 367 Prociccion 371 Elecsién de un modelo de regresion 377 Procedimionto del analisis de verianza 377 Prueba pora ta lineelidad de la regresion: datos con. observaciones repetidas 378 Graficas y transformaciones de datos 387 Estudio de regiesion lineal simple 391 Correlacion 994 Ejercicios de repase 400 12 Regresion lineal multiple 405 124 122 123 124 125 126 127 128 129 12:10 13 Experimentos de 131 132 133 134 Introduccién 405 Estimacion de los cosfcientos 406 Modelo de rearesién lineal con ol uso de matrices 410 Propiedades de los estimadores do minimos cuadiados 418 Inferencias en la regrosién lineal multiple 420 Eleccién de un modelo de ajuste a través de la prueba do hipotesis 427 Caso aspecia de ortogonalidad 491 Méiodos secvenciales para la celeccion del modelo 435 Estudio de residuce y violacién de suposiciones 441 Validacién cruzads, C,, otros crterios para la Seleccon del modelo 445 Fjercicios de wopaco 456 un factor: general 461 Tecnica del andlisis de varianza 461 La estrategia del diseno experimental 463 Analisis de varianza unilateral: disefio completamente alpatonizado 463, Pruebes dela igualdad de vatias variancas 470 Contenido 13.5 Comparaciones de un solo grado de libertad 475 136 Comparaciones miiltiples 475 13.7 Comparacion de tratamientos con un control 483 138 Comparacién de un conjunto de t 08 en bl nto de tratamiontos en bloques 483 139 Diseno de bloques completos aloatorizados 469 13.10 Métodos gréficos y diagnéetices posteriores 498 13.11 Cuadrados latinos 499, 13.12 Modelos de ofectos alestorics 506 13.12 Enfoque de regresion para el andlisis de vrianza 611 13.14 Potoncia de las pruebas de analisis de varianea 612 18.15 Estudio de caso 519 Ejercicios de repaso 523 14 Experimentos factoriales 527 14.1 Introduccion 527 142 _Interaccion y el experimento de dos factores 529 14.3 Anélisis de varianza de dos factores 530 14.4 Andlisis grafico en el problema de dos factores 537 145. Experimentos de tres factores 540 186 Modelos muttifactoriales especificos 548 14.7 Exporimantos factoriales modelo Il y Ill 543 14.8 Eleccidn del tamaio de la muesira 552 Ejercicios de repaso 555 15 Experimentos factoriales y fracciones 559 15.1 Introduccién 559 15.2. Anélisis de varianza 560 15.3 Experimento 2* factorial sin replicas 554 15.4 Estudio de caso 565 18.5 Experimentos faotoriales en bioques incompletos 571 15.6 Confusion parcial 577 15.7 Experimentos factoriales en un ajuste de rearesion 579 15.8 Estudio de caso: exparimento de purificacion de carbén 583 15.9 Experiments factoriales fraccionados 588 15.10 Analisis de experimentos factoriales fraccionados 501 415.11. Disonos do fraccionos euporioros y depurados 595 16.12 Construcsién de disenos de resolucién Il y IV con 8, 18 y 32 puntos de diseio 596 15.13. Otros disenos de resolucidn Ill de dos niveles; disenios de Plackett-Burman 587 18.14 Diseno robusto de parametros de Taguchi 598 Ejercicios de repaso 607 Contenido 16 Estadistica no paramétrica 609 16.1 16.2 16.3 16.4 165 166 167 168 Pruebas no paramétricas 609 Prueba de signo 510 Prueba de rango con signo 614 Prueba de la suma de rangos 620 Prueba de Kruskal Wallis 623 Pruebas de corridas 625 Limites de tolerancia 629 Coeficiente de correlacién de rango 630 Ejercicios de repaso 634 17 Control estadistico de calidad 635 74 17.2 173 74 175 17.6 Bibliogratia 667 Introduccién 635 Naturaleza de los limites de control 637 Propésitos de la grafica de control 637 Graficas de control para variables 638 Graficas de control para atributos 653 Graficas de control de cusum 660 Ejercicios de repaso 664 Apéndice: Tablas estadisticas 671 Respuesta a ejercicios con numero impar 723 indice 737 Prefacio La sexta edicién de Probabilidad y estadistica para ingenieros destaca la teorfa esta- distica y pone un énfasis apropiado en el andlisis de datos, el eélculo estadistico y la mejora de la calidad. Nuestro objetivo es presentar al estudiante los elementos de la probabilidad y las distribuciones de probabilidad, la inferencia estadistica, la re- gresi6n y correlacién lineal, el andlisis de varianza. el disefio de experimentos y el control estadistico de la calidad. Este equilibrio entre la teoria y la metodologia ha encontrado histdricamente aceptacién por parte de los revisores y los usuarios del texto. La quinta edicion destacé la introduccidn de impresos de software para real- zar los ejemplos ¢ introdujo también los métodos graficos en el anilisis de datos. ‘Ambos temas se refuerzan en la sexta edicién, con impresos adicionales incluidos enel texto y también junto con casos de estudio dentro de los ejercicios. Oura ven taja de este texto es la abundancia de ejercicios de la “vida real” que incluyen con- juntos de datos de estudios reales realizados por ingenieros y cientificos. Se amplian los ejercicivs, en particular para las areas de pruebas de dos muestras y estimaci6n del intervalo de confianza, andlisis de varianza de uno y dos factores, y anilisis de regresion. A peticion popular, se proporcionan las respuestas para los ejercicios im- pares Un prerrequisito para el uso de este texto es un curso de calculo diferencial integral, con detivacién parcial e integracién multiple. Siel instructor intenta hacer un tratamiento completo de la regresion lineal multiple, seria util un curso de alge- bra lineal y matrices. x Pretecio importantes en la sexta edici6 1. El primer capitulo ho sido ampliade para proporcionar al lector wna introduc. cid sélida de las nociones de posicion y variabilidad. Se han agregndo Gjerei- clos este capitulo, 2. En casi todos los capitulos aparecen nuevos ejercicios de bi puesto énfasis en los ejercicios de repaso, ida real”. Se ha 3 Se introducen distribuciones uniformes continuas y logarftmica normal, sein fumica normal cluyen aplicaciones y ejercicios con el uso de la distribucion log 4. Se hace énfasis apropiado en el uso de la distribuci6n ¢ para adaptar pruchas y laestimacidn que incluye dos medias con varianza no homogen Se omite la seccidn yobre tearfa de la decisiin y se hace mas Enfasis en la est ‘maci6n de la probabilidad maxima. Se utilizan mas ejemplos y ejercicios para reforzar ef material det (esto sobre probabilidad maxima, 6. Se abarea ea forma mas completa el uso del ‘lgehra matricial en el andlisis de la parte de vari iple. se complementa con Ia inclusion de EL capitulo sobre experimenios factorial modelos mezclados, 8. En los capitulos de rey de “casos de estudio” y se incluyen muesiras de impresos de computadora. lente sitio ftp: ccom/pubiesm/statistis.027/walpole/probability_ statistics resin maltiple y andlisis de varianza apareven ejercicios 9. Los archivos de datos para este libro se pueden descargar del Atpsivav.w.prenh Este texto esti disefiado para un eurso de uno o de dos semestres. Un curso de tun semestre que contenga el tratamiento de probabilidad c inferencia estadistica se adapta con el material de los eapitulos 1 al 16, Sin embargo, existe mucha flexi dad para el uso de estos capitulos. Despus de la nueva introduccion, los capitulos 2, 3 4 cubren la probabilidad basica y las variables aleatorias. Los capitulos 5 y 6 tratan las distribuciones especificas, sus aplicaciones y las relaciones entre distribu: ciones. El capitulo 5 trata las distribuciones disoretas. incluida la binomial y la hic pergeométrica multinomial, binomial negativa, geométrica, uniforme y de Poisson El capitulo 6 explica la normal (incluye la apreximacién normal la binomial), gam- _ma, logaritmica normal, exponencial, ji cuadrada y otras distribuciones tiles. Es po- sible que, para un curso mas te6rieo, el instructor pueda elegit no utlizar la {otalidad del material en estos des capftules. Por otro lado, un curso para ingenie- ros ciestamente se beneliciaria de la discusion de las reas de aplicacion de estas im- portantes distribuciones y del uso de les ejerccios. lo 7 es un capitulo corte titulado Funciones de variabies aleatorias y es el tema mais matemitica de! ibro. Se incluye el uso de funciones generadoras de momento y técnicas para calcula Ia dis- tribucién de funciones de variables aleatorias. El instructor que esté mas inelinado ‘ enfatizar la estadistica matemstica puede preferir incluilo, El capitulo & contiene tres importantes temas relacionados: muestrev alealorio, ddescripcidn de datos y distribuciones de muestreo fundamentates. Como se meng 16 al principio, se pone considerable atenciGn al éespliegue de datos y @ las grt ‘cas. Ademas, se colocan las bases para el uso de percentiles y la graficacion de Ia Pretacio x probubilidad normal en aplicaciones que aparecen en los caphiulos siguientes. Se is- cute Ia dstribueibn de X y S, y se proporciona la motivacion para si uso en los dos capitulos siguientes. este respecto, se introducen ls distribuciones ty F. asf como la motivacion para su uso en la estimacién del intervalo la prueba de hipstests. Los capitutos 9 y 10 contienen material sobre la estimacién de una y dos mus tras y la prueba de hipdtesis, respectivamente. Se incluyen nuevos ejereicios y ejem plos, ¥ Se introduce al estudianie 4 conjuntos de datos de “la vida real”, Las iustraciones incluyen el uso de comporaciones gréficas asi eomo Ia inferencia for mal —impresos de computadora comentados forman parte dela ilistracion, El ca pitulo 9 inclaye tambicn material sobre probabilidad masima yestimacion de Bayes Las pruebas tesricas normiates que ineluyen ls distribuciones 1, Fy y'se dan en el capitulo 10, como pruebas que implican el uso de datos categoricos, Los eapitulos Ly 12se ocupan de la rezresidn lineal simple y la regresidn mltiple. espectiva mente, Como en el pasado, se incluyen ls critetios de selecsicn de! modelo de un solo numero, procedimientos paso paso. di diseusidn de transform: \stico con grifieas de residuys y une El capitulo 13 es una presentacién del problema de un factor. Se introduce el analisis de vatiana para prueba de medias. Se incluyen los blogues, cuadrados lati anos y el modelo de efectos ateatorios, Un extenso estudio de caso iustra fa unin de graticas estadisticas la inferencia formal. Elcapitulo [4 contiene e| experimen: to factorial general, con grificas e impresos de computadora comentados y resala- dos una vez mis. El capitulo 1S contiene el material mensionado con anterioridad sobre experimentos 2 factorialesy fraccionales,ineluidos los bleques y a confusién. Se resaltan los métodos modernosde mejora de la calidad por medio de ejemplos y ‘easosde estudio, y se explican la metodologia de Taguchi asf como modelado Ue va rianza, El capitulo 16 se ocupa de los precedimientos no paramétricos, y el capitu- lo 17 estd dedicado al control estadistico de la calidad. Los capitulos 11 a 17,2 nuestro juieio, proporcionan material suficiente para un segundo semestre. Cada capitulo contiene suficiemte flexibilidad y permite la omi- sin de secciones sin pérdida de comtinuidad ‘Queromos agradecer a los que contribuyeron con la prepara edicién, Agradecemos a Linda Seawell, que mecanografis el manuscrito. De nuevo, muchas gracias al Centro de Consulta Estadistica del Instituto Politécnico de Virgi- nia: fuente de muchos de los conjuntos de datos de la “vida real” que se uiilizan co mo ejemplos y ejercicios. Estamos en deuda con aquellos colegas que revisaron la sexta edici6n y propor cionaron muchas sugerencias titles para esta ediciin, Elles son Melinda McCann, Universidad Estatal de Oklahoma: Bill Beyer. Universidad de Akron; Michael Merscher, Universidad Tecnolégica Lawrence: v Kyuil Kim, Universidad de Ilinois en Chicago. También estamos en devda con el albacea literario del fallecido sir Ronald A. Fisher, F-R.S., Cambridge, y a Oliver & Boyd Ltd., Edimburgo, por su permiso pa- ra reimprimir una tabla de su libro Statistical Methods for Research Workers:al pro- fesor E. 5. Pearson y a los administradores de Biometrika por el permiso para reimprimir de forma condensada las tablas & y 18 de Biometrika Tables for Stati cians, vol |; a Oliver & Boyd L.td., por el permiso para reproducir tablas de su br0 ion de esta sexta Prefacio Design and Analysis of Industrial Experiments de O. L. Davies: a McGraw-Hill Book Company por el permiso para reproducir las tablas A-25d y A-25e de su libro Introduction to Statistical Analysis de W. J. Dixon y R. J. Massey, Jr; a C. Eisenhart, M. W. Hastay y W. A. Wallis por el permiso para reproducir dos tablas de su libro Techniques of Statistical Analysis. También deseamos expresar nuestro aprecio por el permiso para reproducir tablas de los Annals of Mathematical Statistics, del Bu- Metin of the Educational Research at Indiana University, de una publicacién de la American Cyanamid Company, de Biometrics, de Biometrika, vol 38, y de la Jour- nal of the American Statistical Association. RAM. S.L.M. Introduccién a la estadistica y al andlisis de datos 1.1 _Repaso CN a En Ja industria estadounidense se dedica una cantidad extraordinaria de atenciGn al mejoramiento de ta calidad que comenzé en los ocheata y cantina en la presente déeada. Se ha dicho y escrito mucho del “milagro industrial” japonés que comenzs en la segunda mitad del siglo xx, Fueron eapaces de tener éxito donde nuestio pais (E.U,) y otros paises fallaron —a saber, en la creacisn de una atmésfera que permi. te la manufactura de productos de alta calidad. Gran parte del éxito de los japone s2s se atribuye al uso de méodos esadisiicas y al pensamiento estadistico entre | personal gerencial El uso de métodos estadisticos en Is manufactura, ol desarrollo de productos alimenticios, software de computadoras, productos farmacéuticos y muchas ottas ‘reas implica el acopio de informacién o datos eientificos. Por supuesio que o aco piio de datos no es algo nuevo, ya que se ha realizado por mas de mil alos. Les da~ tos se han reeabado, resumido, reportado y almacenado para su examen euidaloso. Sin embargo, hay una diferencia profunde entre teeabar informacion cientifica y la ‘estadistiea inferencal. Es esta ttima la que ha resibido legitima atencion en las ce numero enorme de herra mientas analiicas que permiten al ingeniero o al eientifico comprender mejor los sistemas que generan los datos, Esto refleja la verdadera naturaleza de la ciencia {que Hlamamos estadistica inferencial, pneipalmente el uso de técnicas que nos per- ‘miten ir mas alla de solo reportar datos sino, mis bien, nos permite obtener concli- siones (0 inferencias) sobre el sistema ciemtifico, Los estadisticos hacen uso de leyes fundamentales de probabilidad e inferencia estadistica para sacar conclusiones sobre los sistemas cientificos, La informacién se colecta en forma de muestras, 0 1 2 captuie + itrodeccisn agrupaciones de observaciones, En el capitulo 2 se introduce el proceso de mues treo y la dscusién continda ao largo de todo el libro, Las muesteas se tetinen « par ‘on agrupaciones de todos losindividuos o elementos individuales de un tipo particular, A veees una poblacion significa un sistema cieniifico, Por ejemplo, un fabricante de tarjetas de computade ra puede desear eliminar defectos. Un proceso de muesiren puede implicar la rece leecién de informacién de 50 tarjetas de computadora probs el proceso, Aqui. la poblacién es todas las tarjetas de computadora prod ln empre ‘na muestra de pacientes y a eada uno se le administra un medicamento especifian vducit la presi6n sanguinea. Se onfogs el interés en la cbtencion de conelusio. en un period espectfic, En un experimento con medi para sobre li poblaciin de los que sufren de hipertensidn. Si se hace una mejora en el proveso de produccidn de las tarjetas de computadora y se reine una segunda muese a de tarjetas. cualesquicra conchisiones que Se obtengan respecto laetectividad del cambio en el proceso x debe extender toda la poblacion de tarjetas de computado- tu ques produzcan bajo el proceso mejorads ‘A menudo, es muy importante el acopio de datos centilicos en forma sistemé- tie, enando fa planeacton ocupa un lugar importante en fe agends. En ocasiones la plaeacion esta, por neeesidad, bastante limitada, Lin ingenicro puede necestar es- {udhar el efecto de las condones del proceso, temperatura, humeded,cantidad de lun ingrediente particular, eteétera, sobre ln produecidn del articulo. Elo ella pue- den mover de mancra sitemstica estos faeores a cualesquiera niveles que se sugie- Fan de acuerdo con cualquier prescripcign o disefo experimental que se desce Sin embargo. un cientifieo sivicultor que est interesado en un estudio de los factores In densidad de la madera en cesta clase de debol no necesariamen un experimento, En este caso puede requctir un estudio observa 1 que los datos e acopian en el eampo pero no ve pueden seleccionar Je sintemano los niveles de los fuetores, Ambos tipos de estudios se presta Ios ne todos de la inferencia estat deri de la planeacin aproy el ultimo, el cientitico esta a smersed de lo que pueda recopilar. Por ejemplo, resulta madecuado sun agrénomo be interesa en estudiar el efecto de a Huvia sobre la produscion de plantas y los di- {os se obifenen durante una sequia. Se debe comprender la importancia del pensamiento estadistico en los admic nistradores ef uso de la inferenciaestadisica por el personal centifie. Losinves- tigadores obtienen macho de los datos cientificos. Los datos proporcionan una ‘comprensidn del fensémeno cientifico. Ls ingenieros de producto y procesosapen= den mis en sus es{uerzos fuera de linea para mejorar el proceso. También logean tuna comprensisn valiosa al reunir dates de producci6n (mionitoreo en linea) con una base regular. Fsto permite la determinacidn de las modificaciones necesatias afi dle mantener el proceso en un nivel deseado decal 1.2 El papel de la probabilidad Fa este libro, los capitulos 26 tratan de Tas nociones fundamentales de la proba idad. Una obtencion esmerada de Ins bases de estos conceptos permite al lector {rar una mejor comprensién de ln inferencia estaditica, Sin algo de forms studiante no puede apreciar ls verdadera interpretacion del a ‘Seccion 12 £1 papet de a provabilided 3 de datos mediante los métodos estadisticos modemos. Es completamente natural es- tadiar probabilidad antes de estudiar inferencia estadistiea, Los elementos de proba. bilidad nos permiten cuantficar la fuerza o “eontianza’” en nuestras conclusiones, Ejemplo 1.1 Suponga que un ingeniero se encuentra con datos de un proceso de produccion cn el que’se muestrean 100 articalos y se enewentra que 10 estén detec {twosos. Es de experarse que de ver en cuando habré artieulos defeetuosos. Sin em bargo, se determina que, a largo plazo, Ja empresa sélo puede tolerar 5% de articulos defectuosos en cl proceso. Ahora bien, los elementos de probabilidad per miten al ingeniero determinar qué tan concluyente es la informacion mucstral con respectoa la naturaleza del proceso, Supong, ‘que averiguamos que si el procese es ‘ceptable, es decir, si produce articulos con el 5% defeciuesos, hay una probabil dad de 0.00001 de obtener 10 0 més articulos defectuosos en una muestra sleatoria de 100 articulos del proceso. Esta pequeria probabilidad sugiere que el proceso, en realidad, tiene un potcentaje de artieulos defectuosos en el largo piazo que excede ‘un 5%. En otras palabras, bajo la condicion de un proceso aceptable. la informacion ue se obiuvo casi nunca ocuriria. Claramente, sin embargo, ocurriria con tuna probabilidad mucho masala si la tasa de articulos defectuosos del proveso ex ccediese 5% por un monto significativo. De este ejemplo es evidente que los elementos de probabilidad ayudan en la trade ‘cidn de informacion muestral en algo concluyente o no concluyente acerca del sis tema cientifico, El ejemplo que sigue proporciona una segunda tlustracidn. El valor 0.00001, que jugo un eran papel en nuestra conclusidn, a menudo se denomina Yae lor P. En los capitulos siguientes se trata detenidamente el concepto de valor-P. Ejemplo 1.2 Con frecuencia la naturaleza del estudio cientificn sefilaré el papel {que juegan la prohabilidad y el razonamiento dedctivo en la inferencia estadistica El cjercicio 6 al final de Ia soccidn 9.8 proporciona datos asociados con un estudio aque se lev a cabo on cl Instituto Politéenico y Universidad Estatal de Virginia so bre el desarrollo de una zelacién entre las raicos de les drboles yla cin de un hon: 180. Se transfiicron minerales de los hongos a los érboles y azticares de los érboles ‘al hongo. Se piantaron dos muestras de 10 plantones de roble rojo norten en un in- Vernadero, una que contenta plantones tratados con nitrégeno y una muestra de plantones sin tratamiento. Todas las demas condiciones ambientales se mantuvie- ron constantes. Todos los plantones contenian el hongo Pisolhus ronerorus. En el capitulo 9 se proporcionan mis detalles. Los pesos de los tallos en gramos se tegis- traron al finalizar 140 dias. Los datos son como sigue: Sin mtrogeno Con nltedgeno 032 0.26 053 0.8. 028 00 0 02 0, on 20) 3 on 03 046 4 Capito 1 Introsuccion» la ostadiaticay et ends de tetas a % a8 40 $+ 4 +4 + +4 5 o 6 70 75 0 85 90 Figura 1.1 Pesos detos los Ex conveniente graficar los datos comp se muestra en a figura 1. Los valores, presentan Tos datos “con nitrégeno” y los valores » representan los datos “sin ni- Ahora bien, el propésita de este experimento es determinar si el uso de nitrgeno tiene inflenci en el ereeimiento de las raices. Notese que la aparieneia general de los dates pucde sugerir al lector que, en promedio. el uso del nitrdgene 1a el peso delta lo, Cuatro observaciones con nittégeno son considerable ne més grandes que cwalquic parte de las observaciones sin nit del centro de los pare datos. La apariencia del conjunto de dittos pareceria ind que el nitrdgeno es 10 se puede resumir toda ls cevidencia visual aparente mo en el ejemplo anterior, se pue: izar los tundamentos de 1a probabil. Las conclusiones se pueden res mir en una declaracién de probabilidad o valor P. El problema gira alrededor de la “probabilidad de que datos como estos se puedan observar” dado que el nitrogeno 1no ene efecto, en otras palabras, dado que ambas muestras se generaron a partir de la misma poblacién, Suponga que esta probabilidad es pequesia, digamos 0.03, ésta seria con certeza suficiente evidencia de que el uso de! nitrogeno en realidad in ye (aparentemente aumenta) el peso promedio det rallo. a Dimos dos ejemplos donde los elementos de probabilidad proporcionan un re: ssumen que el cientifien 0 el ingeniero puede wsar como evidencia sobre la eval fin car una decisién. El puente entre los dalosy la conclusisn esta, por supuesto, basido en las fandamentos de Ia inferencia estadistica, la teoria de la distribueién y las dis tribuciones de mutestreos que tratan ¢ iustran en los eapitulos 7 @ 11, Es conve niente en este punto prestar atencién alas medidas de posicién y yariabilidad de la muestra, Tanto cl andlisis exploratorio o intuitive de datos como ka inferencia esta distica Formal dependen de estas medidas. 1.3. Medidas de posicion: media de una muestra Las medidas de posicisn 19 conjunto de datos estin disesadas para proporsionat ita alguna medida cuantitativa de dénde esté el centre de fos datos en ne ‘muestra, En el cjomplo 1.2 ciertamente parece como si el centro de la mucstea con la obvia y muy ail es » Suponge xxcediora al de la muestra sin nitrdgeno, Una me Hay otras medidas de tendencia central que se explican con detalle en eapitulos pos {eriores. Una medida importante es la mediana de la muestra. El proposito de It Inediana dela muestra es reflejar lt tendencia central de la muestra de manera Uk ‘Secciin 14 Medidas do varabilicad — 5 ‘no est¢influida por fos valores extremos, Dado que las observaciones en una mues- fea son 8) tas 4, soomodidos en orden eresieate de magnitud, a mediana dela F > Spenya sinesimpar, = Syat tunes Simespar, Por ejemplo, supor y 147. La media y i t cae nediana de la muestra son, respectivamente, 39.311 e512 Fs 309, Es evidente que la media esta influida de maner: Ja observacion extrema, 14.7, mientras que “centro” del conju el caso del conjunto de datos de dos muestiay del ejemplo 1.8, las dos medidas de tendoneia central pars las muestias individuales “onsiderable por la presencia de la mediana hace énfasis en el verdadero. ¥ Gin nitrSgeno} 0.40 gramos. O37 +042 ¥ (Gin nitrgeno) ~ amos ¥ (con nitrogeno) = 0.57 grams, 049 + 052 ¥ (con nitrogeno) = (0.505 gramos. 1.4 Medidas de variabilidad La variabilidad dv una muestra juega un papel importante en el andlisis de datos. La variabilidad de un proceso y de un producto es un hecho real en los sistemas cient cos y de ingenieria: el control o reduccidn de la variabilidad de un procesoa menudo esuna fuente de dificultades mayores. La variabilidad en valores de poblacion y da- tos de una muestra es un hecho real. Una variabilidad grande enirelas observaciones de una muestra a menudo puede “limpiar” cualesquiera efectos que elingeniero pue- dda tratar de detectar. Lasmedidas de posicin en una muestra no proporcionan un re~ sumen apropiadode lanaturaleza de un conjunto de datos. Es decir, nel ejemplo 1.2 1no podemos consluir que el uso del nitrégeno realza el crecimiento sin tomar en ‘uchtala variabilidad de la muestra. Por ejemplo, compare losdos conjuntos de datos dc abajo. Cada uno contiene dos mucstras y Is diferencia en las medias es aproxima- “damenie la misma para las dos mucstras: Conjunto de datos A: x xX XX XX UX xXOOxx x0 0000000 Conjunto de datosB: | * KX XK XX XX KX 00000000000 | © Copneio 1 inrocuesion ata esactie yo! andinie de doroo Elconjuto de dato i parece proporsionar un contrate mutho mésclar entre junto de datos A. Sil propdsito de tal experiment es dectat ln difcenel ey las dos poblacions, a tres ov Ive cab en el cao del conjuno de dates Be embargo cnet conjnio de daton A ian vara dent de as dos erea dialed. De hecho, no ey tac ub A como hay muchas medias de endencia ental ode posi hay muchas Imes ispersino variablaa Quiz la mssimple esl range del noceey nu. Nyx Elrango puede ser muy uty xe dicute con ampitaden el capes ‘amas a meni sla devon estndar deta musta, Nuctamente devotees 60.4.0, valores dela musta a deseacin estndar de la mas i= (SG 4 una diferencia enire las dos poble Lacantidad ¢ = (x, ~'/( ~ 1) se lama variamza dela muestra. Debe quedr oal lector que la desviciGnestindarde la muestra ex, de hecho, una medida de \aribilidad. Una variabilidad grande en un conjunto de datos produce valores lativamente grandes de (x - 3)" y por ello una vaianza de la mucsiva grande. La camtidad n 14 menudo se denomina grados de libertad asociados con ka varanza estimada. En este ejemplo simple les gradtos de libertad representan el numero de Piezas de informacion independientes disponibles para caleular la varabilided. Por sjomplo, suponga que deseamos calcuar la varianza de la muestra y la desviaciOn stindar del conjuitio de datos (5,17, 6, 4). El promedio de la muestra es 1 ~ 8 El Ccieulo de la yasianza impli 6 - 8) + 07 ~ 88 + (6 — 8) + 4 ~ 8) = (-3 + EF + ( cay Las cantidades dentro de los paréntesis suman cero. En general, ¥ (1, ~ 3) \Véase el ejercico 4. Entonecs el cileulo de una varianza de la muestra no implica n desviacioney cuadradas independientes de la media t. De hecho, como e!tltimia va lor de x ~ x esta determinado por los primerosn ~ | valores, decimos que estas son n~ | “piezas de informacion” que producen s:, Por ello hay n — 1 grados de liber- tad en lugar de m prados de libertad para calcular una varianza de la muestra, 1.5 Datos discretos y continuos La inferenc sis de-estuios observacionales 0 de ex Perimentos disenados se utiliza en muchas dreas centfiens, Los datos reuios pueden ser diseretos 0 eontinuos, dependiendo del étea de aplieavion. Por elen= plo, un ingeniero quimico se puede inteesar en vn experimento que lo leve 4 Condiciones donite se maximice la produecién. Aqut, por supuesto, la producci6n. puede ser en porcentaje, o gramovlibra, medida en un continuo. Par otro lado, i fexicdlogo que realice un experimento de combinacién de férmocos puede onc Secsién 1.6 Modelado estadistica, inspeccién ciemitca y kaandsticos aréticos 7 tos que son binarios por naturaleza (es decir, el paciente responde 6 no). dlos situaciones distintas la teoria de la probabilidad que nos permite extiaer inferencias estadisticas es completamente diferente, En el eapitulo 3 y pos teriores se obtienen diferencias ciones discrotas y continua. 1.6 Modelado estadistico, inspeccion cientifica y diagnosticos graficos Muy a menudo el resultado final de un analisis estadisti es la estimacién de los pa rametros de un modelo postulads. Esto es por completo natural para loscientificos ylos ingenietos, pues con frecuencia tratan con el modelado. Un modelo estadistica tno es delerminista sino, mis bien, debe involucrar algunos aspectos probabilista, Una forma modelo a menudo fundamentaciGn de las suposisiones que hace e) analisia. En nuestro ejemplo 1.2, el cientifico puede desear extract algtn nivel de distinei6n entre la peblacién “con nitéyeno” y “sin nitsgeno” a traves de la infor macion de la muestra, El andlisis puede requerir cierto mocelo para los datos, por ejemplo, que las dos muestras provengan de distribuciones normales o gausianas, \Véase el capitulo 6 para la discusidn de una disiribucion normal A veces e! modelo postulado puede tener una forma algo més complicada, Con sidere, por ejemplo, un fabricante de testiles que disefa un experimento donde las, imuestras de tela se producen de modo que contengan diferentes porcentajes de al- godén, Considere los datos siguientes: Porcomtaje del agedsn Resistencia a la teuecisn 15 7,7.9,8, 10) 20 1, 20,21,20, 22 2 21,21, 17,19,20 30 8.7.8.9,10 Se fabrican cinco muestras de tela para cada uno de los cuatro porcentajes de algodon. Ahora bien, en este caso tanto el modelo para el experiment como el tipo de andlisis que se utiliza deben tomar en cuenta el objetivo del experimento, y los importantes insumos del cieatifico textil. Algunas graficas simples puede aclarar la distincion entre las muestras, Véase la figura 1.2; las medias de las mues: 25 20) a5 i fie teri 18 2 cy 30 Figura 1.2 Gritica de la esistencia ala traccibny ls porcentaes de algocon Capitule 1 Introduccion a a estacistce yal andlisis de datos {ras y la variabilidad se describen bien en la grafica de datos. Un posible objetivo de este experimento es simplemente la determinaci6n de cusles porcentajes de al. goxton son en verdad distintos de los otros. En otras palabras, como en el caso de Jos datos con nitrégena/sin nitrégeno. para cuales porcentajes de algodén hay distinciones claras entre las poblaciones 0, de manera mis especifiea, entre las me. dias de las poblaciones? En este caso, quizd un modelo razonable e+ que cada muestra viene de una distribucién normal, Aqui el objetivo es muy semejante al gcnolsin nitrgeno, excepto que se involucran mas muestras, El formalism del analisis implica nociones de prueba de hipdtesis que se tratan el capitulo 10, De paso, este lormalismo quiza no es necesario a la luz de la aca de diagndstico, Pero, ;describe el objetivo real del experimento y por con Siguiente el enfoque apropiado del andlisis de datos? Es probable que el cient 0 anticipe la existencia de una resistencia a a tracciin de la media dela poblacién mdvima en el rango de concentracién de algodén en el experimento. Aqui el ané- lisis de los datos debe girar alrededor de un tipo diferente de modelo, uno que Postule un tipo de estruetura que relacione la resistencia a Ja iraceiOn de la media {ela poblacién con ta concentracion de algodon. En otras palabras, un modelo se puede escribir como de los datos con nit thy = Ba + B\C + BC donde 1, .¢s le resistencia a la raccion de la media de la poblacion, que varia con Ja canticad de algodon en el producto C., La implicacién de este modelo es que pa- ra un nivel fijo de algod6n, hay una poblacidn de mediciones de resistencia ala trac cidn y Ia media de la pobiacién es 2... Este tipo de modelo, que se denomina modelo de regresién, se trata en los eapitulos 11 y 12. La forma funcional la clige el cientifico. A veces el anilsis de datos puede sugerir quc se cambie el modelo. En- tonces cl analista de datos “considera” un modelo que se puede alterar después de que se haga algin analisis El uso de un modelo empirico se acompaiia por la teo- ria de estimacion, donde f, 8, y f Se estiman de los datos. dems, se puede usar entonces la inferencia estacistica para determinar lo adecuado del modelo. ‘Aqui se hacen evidentes varios puntos de las dos ilustraciones de datos: 1) el tipo de modelo que se utiliza para desoribir los datos a menudo depende del ob- jetivo del experimento y (2) la estructura del modeto debe aprovecharse del inst ‘mo cientfico no estaditico, La seleccion de un modelo representa tina suposici fundamental sobre la que se basa la inferencia estadistica resultante. Se hard evi dente a Jo largo del libro qué tan importantes pueden ser las grificas. A menu, las graficas pueden ilustrar informacién que permite que los resultados de la inf rencia estadistica formal se comuniquen mejor al cientifico o al ingeniero. A veces, las graficas 0 el anilisis exploratorio de los datos pucde enseiiar al analista algo no reeuperado del andlisis formal. Casi cualquier andlisis formal requiere suposi- nes que se desarrolian a partir del modelo de datos. Las graficas pueden resaltat bien la violacion de suposiciones que de otra forma no se notarian. A lo largo del libro, las gréficas se utilizan de manera extensa para complementar el andlisisfor- mal de datos. Seccidn 1.6 Modelado estadistico, inspeccién cientifica y diagnésticos gréficos =O Ejercicios OO 1. Un fabricante de componentes electrénicos se in- teresa en determinar el tiempo de vida de cierto tipo de baterfa. La que sigue es una muestra, en horas de vida: 123, 116, 122, 110, 175, 126, 125, 111, 118, 117 (a) Encuentre la media y la mediana de la muestra (b) Cual caracteristica en este conjunto de datos es la responsable de la diferencia sustancial entre las dos? 2. Un fabricante de neumaticos quicre determinar el didmetro interior de cierto grado de neumatico. Idealmente el diametro seria 570 mm. Los datos son los siguientes: 572, 572, 573, 568, 569, 575, 565, 570 (a) Encuentre la media y la mediana de la muestra. (b) Encuentre la varianza, desviacion estandar y ran- go de la muestra. (c) Mediante el uso de las estadisticas calculadas en las partes (a) y (b), :puede hacer comentarios sobre la calidad de los neumaticos? 3. Se conduce un estudio de los efectos de fumar sobre los patrones de suefio. La medicién que se ob- serva es el tiempo, en minutos, que toma quedar dor- mido. Se obtienen estos datos: Fumadores: 69.3, 56.0, 22.1, 47.6, 53.2, 48.1, 1, 34.4, 60.2, 43.8, 23.2, 13.8 No fumadores: 28.6, 25.1, 264, 34.9, 29.8, 28.4, 38.5, 30.2, 30.6, 31.8, 41.6, 21.1, 36.0, 37.9, 13.9 (a) Encuentre la media de la muestra para cada grupo. (b) Encuentre la desviacién esténdar de la muestra para cada grupo. (c). Grafique los datos como en el caso de los conjun- tos de datos A y Bde la seccién 1.4. (d) Comente qué clase de impacto parece tener el fu- mar sobre el tiempo que se requiere para quedar dor- mido, 4. Muestre que las n piezas de informacin en > (X, — X)' no son independientes; es decir, mues- a tre que (X,- X)=0. im 5. Dados cinco lanzamientos independientes de una moneda que tienen como resultado cinco caras. Re- sulta que si la moneda es legal, la probabilidad de este resultado es (1)° = 0.03125. ¢Produce esto evi- dencia solida de que la moneda no es legal? Comen- te y utilice el concepto de valor P que se discutié en la seccion 1.2. Probabilidad 2.1 Espacio muestral En el estudio de ta estat pretacién de resultados fortuitos que ccurren en un esiudio planeado o investi gacién cientifiea. Por ejemplo, pocemos registrar ol niimero de accidentes que ‘curren mensualmente en la interseecidn de Driftwood Lane y Royal Oak Dave, con el deseo de justifiear la instalacidn de un semaforo; podemos clasiicar 10x articulos que salen de una lines de montaje como “detect uosos” 0 “no defectuosos": ‘onos povdemos interesar en el volume de gas que se litera en una reaceiGn quimica cuando se hace variae la concentracion de un acido, Por ello, el estaditico a menudo trata con datos experimenteles, eonteos 0 mediciones representatives, 0 quid con datas eategéricas que se pueden clisificar de acuerdo con algin criteria. Nos referiremes a cualquier registro de informacién, ya sea numérico 0 categérico, como una abservacién, Asi los nsimeros 2,0, 1 y2, que representan al nidmero de aecidentes que ocurrieron en eada mes de enero a abril durante el af pasado en la intersecei6n de Drifewood Lane y Royal Oak Drive, constituyen Un Conjunto de observaciones, De forma similar. ls datos eategoricas N, Dy N,N Ds {que representan los artculos defectuoses o no delectuosos cuando se inspecciona Ginco artculos, se rezisiran somo observaciones. Losestadisticos utiizan la palabra experimento para deseribir euakquier proces® «que genere tn conjunto de datos, Un ejemplo simple de experimento estadisticn es tla toa are de una moneda, En este experimenta slo hay dos resultados fosibles, cara o cruz. Otro experimento puede ser ef lanzamiento de un misily 1 ‘bservacion de su velocidad en tiempos especies, Las opiniones de los vol ratamos bisicamente con la presentacion e inte Definicion 2.1 ‘$#0010n 21 Espacio muestral 14 ‘con respecto 4 un nuevo impucsto sobre ventas también se pueden considerar como nemo. Etames pacularmententeresadesenlasolnes vaciones que se obicnen por larepeticion dle ee Parte de lon ean os resultados dependern dl azar, por tanto, nose pordche ‘evr comcertea. Sun quimicoeatza un ans args tees bao ns mbna clones, btendra dierentes medidis, que indcan un elemento protabiad al procedimiento experimental. Incluso cuando se lan E efor Fepetia, no podemes tenet ‘perimento varias veces, En la mayor re una moneda de forma erteza de que un lanzamiento dado tendré como embargo, conocemos el eonjunto completo de posibildades El conjunto de todos los resultados posibles de un experimento estadistico se ams espacio muestral se representa con el simbolo $. e Cada resultado en un espacio mucstral se lama elemento o miembro del espe. cio muestra o simplemente punto muesteal Sic! espacio muestral iene un numero finito de elementos, podemos fistar los miembros separados por comas y encortar los en paréntesis. De esta forma el espacio mucstral S, de los resultados pesibles ‘cuando se lan: | aire una moneda, se puede escribir S= 1H), donde Hy T corresponden a “earas” y “eruses”, respectivamente, Ejemplo 2.1 Considere ef experimento de lanzar un dado, $i nos interesamios en ‘el miimero que muestra en la cara superior, el espacio muestral seria $, = 11,2,3.4,5, 6} Sinos interesamos s6io on si el ntimero es par 6 impar, el espacio mucsiral es sim plemente Ss = (par. impar|. El ejemplo 2.1 ilustra el hecho de que se puede usar mas de un espacio mues- tral para deseribir los resultados de un experiments, En este caso S, proporciona ims informacisn que S,, Sisabemos cusl elemento en S, tiene lugar, ppdemos decir cuil resultado ocurre en Sno obstante, el conocimiento de lo que pasa en S,no.es de ayuda en la determinacion de cus! elemento en S, geurre, En general, se des ‘utilizar un espacio muestral que dé la mayor informacion acerca de los resultados del experimento. En algunos experiments ¢s Uti istar los elementos del espat form sistematiea mediante un diagrama de arbol o muestial de Ejemplo 2.2 Un experimento consiste en lanzar una moneda y despues lanzarla tuna segunda vez si sale cara, Si sale cruz.en el primer lanzamiento, entonces se lariza tun dado una ver. Para listar los elementos del espacio muestral que proporcione la mayor informacién, construimos el diaprama de érbol de la figura 2.1. Ahora bien, Jas diversas trayectorias a lo largo de las ramas de! drbol dan los distintos puntos de la muestra. Al comenzar con la rama superior izquierda y moyernos a la derecha a 12° Capito 2 Provavitised ‘Segundo Punto s ” r wr 1 n a ir) 5 rs 6 6 Figura 2.1 Disgrama de arbol para el ejomplo 22 Jo largo Ge la primera trayectoria, obtenemos el punto muestral HTH, que indica fa posibilidad de que ocurran caras en dos lanzamientos sucesivos de la moneda, ‘Asimismeo, el punto muestral T3 indica la posibilidad de que la moneda muestre una cruz seguida por un 3 en el lanzamiento del dado, Al seguir alo large de todas las trayectorias, vemos que el espacio muestral es (MH, HE,T 1,12, 13,18, 15, TO). ’ Ejemplo 2.3 Suponga que se selecionan tres articulos de forma aleatoria de un proceso de fabricacion. Cada articulo se inspecciona y dlasifica como defectuoso.D, 0 sin defectos, N. Para listar los elementos del espacio muestral que proporcione li mayor informacion, construimos el diagrama de srhol de la figura 2.2. Ahora bien, Jas diversas trayectorias ao largo de las ramas del 4rbol dan los distintos puntos muestrales. Al comenzar con la primera Wayectoria, obtenemos el punto mista DDD, que indica a posibilidad de que los tres atieulosinspeccionados sean defee= tuoses. Conforme continuamos a largo de las dems trayectorias, vemos que et espacio muestial es (DDD, DDN, PND, DNN, NDD, NDN, ND, NNN, Los espacios muestrales con un mimero grande o infinito de puntos muestrales se describen mejor mediante un enunciado o regla. Por ejemplo, silos resultados posibles de un experimento son el conjumto de cindades en ef mundo con una poblacién de mas de un mill6n, nuestro espacio muestral se eseribe ‘ciudad con una poblacién de mis de un mill, Ijresu sue a6 lee “Ss 6l conjunto de, tds ln + ales ue ¥ 64 hn ciudad EE Poblacion de més de un millén La barra vertkal s¢ lee “a qe” De manera mila, i ese cenjanto de tos ls puntos (x,y) sobre In fomtera onto tin effeuiode radio ? con eento en el igen, exeribimos Heo wdlat ty? AND NNN Figura 2.2 Diagrama de drbot para el ejemplo 2.3 mes el espacio muestral mediante el método de la regla olistando los <¢lementos dependera del problema especifico en cuestion, El método de ls regla tene ventajas practicas, en particular para los muchos experimentos donde un is tado se vuelve una tarea tediosa. 2.2 Eventos ee Para cualquier experimento dado podemos estar interesacos en la ocurrencia de Cierios eventos mis que en el resultado cle un elemento especifico en el espacio ‘muestral, Por ejemplo, pocemos estar inieresados en el evento Aen el que el resul tad cuando se lanza un dado sea divisible entre 3. Este ocurtiré si el resultado es tun elemento del subconjunio A ~ (3 6 del espacio muestral 5, del ejemplo 21 ‘Como ilustraci6n adicional, nos podemos interesar en el evento B de que-el niimero de defectuoses sea mayor que 1 en el ejemplo 2.3, Esto ocurrird sil resultado es un ‘elemento del subconjunto B= |DDN, DND. NDP, DDD} del espacio muestral 8. Para cada evento asignamos una coleccidn de puntos muestrales, que consti- tuye un subconjunto del espacio muestral. Fse subconjunto representa la totalidad de los elementos para tos que el evento es cierto, 14 capituio2 Probatiicad Delniclén 22: |[Uieveniaeeimmyaninm do mieeIao muna Definicién 2.3 Elemplo 2.4 Dao el espacio muestral § = [1|1= 0}. donde es ta vide en aos de cierto componente eleetrsnico. entone antes de que finalice el quinto an Es coneebible que tn ev espacio muestral S. 0 un subconjunto de S que se denomina conjunte vac se denota mediante el simbato , que no contiene elemento alguno. Por ejemplo, hacemos qt en un expe ento 4 de que el componente falle ilo = 5} fo pueda Ser un subconjunto que incluya todo el esl subconjunto A ¢ Ase el evento de detcetar un organismo microscopico a simple vista imento biokjgico, entonces A ~ B. Tambien. s B = |x| es un factor par de 7) center "es B debe ser el conjunto vacto, ptes 1s Unicos facteres posibles de 7 son los snimeros nones 1 y 7 Considere un experimento donde se regisiran los habites de fumar de los empleacos de una empresa industrial, Un posible espacio muestral podsia clasificas un individuo como no {umador, fumador ligero, fumador moderado o fumador empedernido. Sea el subconjunto de los fumadores un evento. Entonces la totalidad de los no fumadores corresponde a un evento diferente, también subconjuata de, que se denomina complemiento del conjunto de famadores. El complemento de un evento A con respecto a es el subconjunto de todos los elementos de 5 que no estan en A. Denotamos el complemento de A mediante et simbolo 4’. Ejemplo 2.8 "Sea & el evenio de que una carta roja se seleccione de una baraja ordinaria de 52 cartas, y sea $ toda la baraja. Entonces R’ es el evento de que la ‘carta seleccionada de la baraja no sea una roja sino una negra. w Ejemplo 2.6 Considere el espacio muestral libro, catalizador, cigarrillo, precipitado, ingeniero, remache) Sea A (catalizador, remache, libro, cigarillo}. Emionces a’ [previpitado, ingeniero}. Consideremos ahora cierias operaciones con evenios que tenn como tesul tado la formaciéin de nuevos eventos. Estos eventos nuevos seta subconjuntos del inisimo espacio muestra como los eventos dados. Suponge que A y B son dos eve tos atociados com un exporimento. En otras palabras, y Bf son subcomuntes del ‘mismo espacio muestal §. Por ejemplo, en el lanzamiento de un dado podemos hacer que A sea el evento de que acurra un numero par y Bel evento de que ‘sparezca un mero mayor que 3. Entonces los subconjuntos A = (2,4, 6]y B = fs 5,6} son subconjuntos del mismo espacio muestral $= (1,2,3,4,5,6) Definicion 24 Definicion 2.5, Seccidn 22 Eventos 18, Nétese que A y B ocurririn ambos cn un lanzamiento dado si el resultado es un ele- ‘mento del subconjunto (4, 6}, que eS precisamente la interseccion de A y B. La interseccién de dos eventos A y B, denctada mediante el simbolo A 7B, es el evento que contiene a todos los elementos que son comunes aA ya B. Ejemplo 2.7 Sca P cl evento de que una persona seleccionada al azar mientras cena en un restaurante de moda sea un contribuyente, y sea Q el evento de que la penona tenga mas de 65 anos de edad, Entonces el evento PA Q es el conjunto de todos los coniribuyentes en el restaurante que tienen mas de 65 afiosde edad. Ejemplo28 Sean M = (a.e.i.0.u) yN = (rssh entonces se sigue que M ON = @), Fs decit, M y N’ no tienen elementos en comin y, por tanto, no pueden ecurrir ambos de forma simultinca Para clertos experimentos estadisticos no es nada exirafio definir dos eventos, Ay B. que no pueden ocurnr de forma simultdnea, Se dice entonces que los even: tos A y B son mutuamente exeluyentes. Expresado de manera mas formal. tenemos Ja definicién siguiente: Dos eventos A y B son mutuamente exeluyentes 0 disjuntos si A 0 B =O: es decir, si A y B no tienen elementos en comin. Ejemplo 29 Una compania de television por cable ofrece programas en acho diferentes canales, tres de los cusles estén afiliados con ABC, dos con NBC, y uno con CBS. Los otros dos son un canal educative y ef canal de deportes ESPN. ‘Suponga que tuna persona que se suscribe a este servicio enciende an televisor sin selescionar de antemano el canal. Sea A el evento de que el programa pertenezca & Jared NBC y B el evento de que pertenezca a la red CBS, Como un programa de televisi6n no puede pertenecer a mas de una red, los eventos A y B no tienen pro- ‘gramas en comtin, Por tanto, la interseccién A 1 B no contiene programa alguno y fen consecuencia los eventos A y 8 son mutuamente excluyentes. = A menudo nos interesamos en la ocurrencia de al menos uno de dos eventos aso- cciados con un experimento, Asi, en cl experimento de lanzamiento de un dado, si 2.4.6) y B= 14.56), podemios interesamnos en que ocurra A 0 B, 0 que ocurran A y B. Tal evento, que Se llama la unién de A y B, ocurriré siel resultado es un elemento det subconjunto (2.4.5.6). La uni6n de dos eventos A y B, que se denota mediante el simbolo AU B, es |evento que contiene todos los elementos que pertenecen a A oa B 0 ambos.

También podría gustarte