Está en la página 1de 72
Probabilidad y estadistica aplicadas a la ingenieria Segunda edicién Douglas C. Montgomery Universidad Estatal de Arizona George C. Runger Universidad Estatal de Arizona LIMUSA WILEY & Lc DEWEY CUTTER QA276.12 620.015 M 66p VERSION AUTORZADA EN ESPANOL DE LA OBRA PUBLICADA EN INGLES CON EL TITULO: APPLIED STATISTICS AND PROBABILITY FOR ENGINEERS (© Jows Witey & Sons, Inc, New York, CwicHesteR, Briseane, Smeapor€, ToROWTo AND WENMEM, ‘CoxanonAcon EN LA TRADUECION: RODOLFO PINA GARCIA Revisow: ALMA ROSA GRISELDA ZETINA VELEZ InGeMERA QUIMICA POR LA FACUCTAD De QUNAICA DE LA UUnevensiono NACIONAL AUTONOMA De Mexico. DOceNTE [ENMATEMATICAS, JEFA DEL DEPARTAMENTO DE ESTAOISTICA DE LA UNIDAD CE ADMINTAAGIGN DEL PosGRADO DGAE- UNAM. Proresona en La Escueta oe Ciencias Qui ‘CAS DE LA UNvERSIDAD La SALE, La pRESENTAGION OIGPOSIGON EN CONAINTO DE PROBABILIDAD Y ESTADISTICAAPLICADAS. ALAINGENIERIA '50n PROPIEDAD Det DITOR. NSVGUNA PARTE DE ESTA OBRA PUEDE SER REPRODUCIOA O TRANSMTIDG, MEDIANTE NNGUN SISTEMA 0 METOOO, ELECTAOMOOMECKICO (NELUYENDO EL FOTOCOPADO, LA GRABACION O CUALQUER SSTEMA OE [RECUPERACION Y ALMACENAMIENTO DE INFORMACION), 59 CCONSENTAMENTO POR ESCRTO DEL EDTIOR, Derechos neseAvabos: ©2003, EDITORIAL LIMUSA, S.A. oe CV. GRUPO NORIEGA EDITORES Brunenas 95, Méxco, DF. CP. 08040 ‘6503 8050 01(800) 706 8100 @ s512 2903 ‘yg, Htusa@norioga com me su rion comm ANIEM Now, 121 Prera REIMPAESION DE LA SEGUNDA EDICON Hecho en México ISBN 968-18-5915-4 8 El papel de la estadistica en la ingenieria PLAN GENERAL DEL CAPITULO 1-1 ELMETODO DE LA INGENIERIA 1.3. MODELOS MECANICISTA Y Y EL PENSAMIENTO ESTADISTICO. EMPIRICO. 1-11 La ingenieria y la solucion 1-4 DISENO DE INVESTIGACIONES de problemas EXPERIMENTALES 141.2. El pensamiento estadistico 15 OBSERVACION DE PROCESOS 12 RECOLECCION DE DATOS pete ae DE INGENIERIA 1-1 EL METODO DE LA INGENIERIA Y EL PENSAMIENTO ESTADISTICO, 1-11 La ingenieria y la solucién de problemas Un ingeniero es alguien que resuelve problemas de interés para la sociedad mediante la aplica- Ci6n eficiente de principios cientificos. Los ingenieros Hevan a cabo esta tarea perfeccionando un producto o un proceso existente o bien disefiando un producto 0 proceso nuevo que satisfaga las necesidades de los consumidores. El método de la ingenieria 0 cientifico es el enfoque aplicado para formular y resolver estos problemas. Los pasos del método de la ingenierfa son los, siguientes: 1, Desarrollar una descripein clara y concisa del problema. 2. Identificar, al menos de manera tentativa, los factores importantes que afectan el pro- blema o que pueden jugar un papel en su solucién. EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA 3. Proponer un modelo para el problema, utilizando los conocimientos cientfficos 0 de la ingenieria del fenémeno bajo estudio. Consignar todas las limitaciones y/o supuestos del modelo. 4, Realizar los experimientos apropiados y recolectar datos para probar o validar el mo- delo tentativo 0 las conclusiones planteadas en los pasos 2 y 3. 5. Refinar el modelo con base en los datos observados. 6. Manipular el modelo para contribuir a desarrotlar una solucién del problema 7. Realizar un experimento apropiado para confirmar que la solucién propuesta del pro- blema es efectiva a la vez que eficiente. 8 Sacar conclusiones o hacer recomendaciones con base en la solucién del problema. En la figura 1-1 se muestran los pasos del método de la ingenierfa. Obsérvese que el método de Ja ingenierfa implica una estrecha interaccién entre el problema, los factores que pueden influir en Ia solucién, un modelo del fendmeno y la experimentacién para verificar la adecuacién del modelo y la solucién propuesta del problema. Los pasos 2 al 4 de la figura 1-1 estén encerrados en un recuadro, indicando que pueden requerirse varios ciclos o iteraciones de los mismos para obtener la solucién final. Por consiguiente, los ingenieros deben conocer una manera eficiente para planear experimentos, recolectar datos, analizar ¢ interpretar datos, y entender cémo se relacionan los datos observados con el modelo que han propuesto para el problema bajo estudio. El campo de la estadistica trata de la recolecciGn, presentaciGn, andlisis y uso de datos para tomar decisiones, solucionar problemas y disefiar productos y procesos. Debido a que diversos aspectos del ejercicio de la ingenieria implican trabajar con datos, resulta evidente la importan- cia de ciertos conocimientos de estadistica para cualquier ingeniero. Especfficamente, las técni cas estadisticas pueden constituir una poderosa ayuda para diseitar nuevos productos y sistemas, mejorar disefios existentes, asf como para disefiar, desarrollar y mejorar procesos de produc- cién, Desarollar una dseripeién clara | | Menitcar os fctres importantes '¢ i Propone 0 refinar on model | Maniputar et modelo i —4 Confirmar la solucidn 4 ‘Conclusiones y recomendaciones Figura 1-1 El método para resolver problemas. EL METODO DE LA INGENIERIA Y EL PENSAMIENTO ESTADISTICO 3 Los métodos estadisticos se utilizan como ayuda para describir y entender la variabilidad. Por variabilidad se entiende que observaciones sucesivas de un sistema o fenémeno no produ- cen exactamente el mismo resultado. Todos nos encontramos con la variabilidad en nuestras vidas cotidianas y el pensamiento estadistico puede ofrecernos un recurso conveniente para incorporar esta variabilidad en nuestros procesos de toma de decisiones. Por ejemplo, considé- rese el rendimiento del tanque de gasolina de un automévil. ;Se recorre siempre el mismo kilo- metraje con cada tanque de combustible? Desde luego que no; de hecho, en ocasiones el kilometraje recorrido varia considerablemente. Esta variabilidad observada en el rendimiento por tanque depende de muchos factores, como las condiciones de manejo que han ocurrido mas recientemente (en ciudad en carretera), los cambios en el estado del vehiculo con el tiempo (que podrian incluir factores tales como la presiGn de las Hantas, la compresiGn del motor o el desgaste de las vélvulas), el tipo y octanaje de la gasolina usada, y posiblemente hasta las cor diciones meteorolégicas que hayan prevalecido recientemente. Estos factores representan fuen- tes de variabilidad potenciales en el sistema. La estadistica proporciona un marco para deseribi esta variabilidad y para saber cules de las fuentes de variabilidad son més importantes o cules tienen el mayor impacto sobre el rendimiento por tanque de gasolina. La variabilidad también esta presente cuando se abordan problemas de ingenierfa. Por ejem- plo, supdngase que un ingeniero esté diseftando un conector de nylon que se usaré en un motor de automévil. El ingeniero est considerando establecer la especificacién de disefio del espesor de la pared en 3/32 de pulgada, pero se encuentra un tanto inseguro acerca del efecto de esta decisién sobre la fuerza de desconexién del conector. Si la fuerza de desconexién es muy débil, el conector puede provocar una averfa cuando esté instalado en un motor. Se hacen ocho unida- des prototipo y se miden las fuerzas de desconexién, produciendo los siguientes datos (en bras-pie): 12.6, 12.9, 13.4, 12.3, 13.6, 13.5, 12.6, 13.1. Como se anticipaba, la fuerza de desconexién no es la misma para todos los prototipos. En la figura 1-2 se presenta un diagrama de puntos de estos datos. El diagrama de puntos es una gréfica muy itil para ilustrar un ntimero reducido de datos, digamos hasta unas 20 obser- vaciones. Esta grafica permite ver con facilidad dos caracterfsticas de los datos: la localizacién, © parte de en medio, y la dispersién o variabilidad. Cuando el nimero de observaciones es reducido, suele ser dificil identificar algtin patron de variabilidad especifico, aun cuando et diagrama de puntos es una forma conveniente para observar cualquier caracterfstica inusual de Ios datos. ‘También es posible describir numéricamente las caracterfsticas de los datos. Por ejemplo, la localizaci6n o tendencia central de los datos puede caracterizarse con el promedio aritmético ordinario 0 media. Debido a que lo més comtin es considerar los datos como una muestra, nos referiremos a la media aritmética como la media muestral. 2 B 4 15 Fuerza de desconexién Figura 1-2 Diagrama de puntos de los datos de la fuerza de desconexién cuando el espesor de las paredes es 3/32 de pulgada. 4 FL PAPEL DE LA ESTADISTICA EN LA INGENIERIA Si las n observaciones de una muestra se denotan pot x, 23... %,,entonces la media muestral es fit (1) EJEMPLO 1-1 ‘La media muestral de la fuerza de desconexién de las ocho observaciones realizadas en los conectores prototipo es ita ben, Ss 12.6412.9-4--413.1 oe 8 x Una interpretacién fisica de la media muestral como medida de localizacién se muestra en la figura 1-3, que es un diagrama de puntos de los datos de la fuerza de desconexi6n. Obsérvese que la media muestral x = 13.0 puede pensarse como un “punto de equilibrio”. Es decir, si cada observaci6n representa | libra de masa colocada en el punto correspondiente sobre el eje x, entonces un fulcro localizado en x equilibrarfa exactamente este sistema de pesos. La media muestral es el valor promedio de todas las observaciones del conjunto de datos. Por lo general, estos datos son una muestra de observaciones que se ha seleccionado de una poblacién de observaciones més grande. En este caso, la poblaciGn podria componerse de todos los conectores que se venderén a los consumidores. En ocasiones existe una poblacién fisica real, como un lote de pastillas de silicio producidas en una fébrica de semiconductores. También podria considerarse el célculo del valor promedio de todas las observaciones de una poblacién. A este promedio se le lama la media poblacional y se denota por la letra griega Ut (mu). 7 2 i 4 5 Fuerza de desconexién Figura 1-3. La media muestral es el punto de equilibrio de un sistema de pesos. EL METODO DE LA INGENIERIA Y EL PENSAMIENTO ESTADISTICO. : Cuando hay un némero finito de observaciones (digamos N) en la poblacié: ‘media poblacional es » N |, entonces fa (1-2) B La media muestral, x, es una estimaci6n razonable de 1a media poblacional j1. Por Jo tanto, el ingeniero que disefta el conector utilizando un espesor de la pared de 3/32 de pulgada conclui- ria, con base en los datos, que una estimaci6n de la fuerza de desconexién media es 13.0 libras- pie. En capftulos posteriores se discutirén los modelos para poblaciones infinitas, lo cual levaré a una definicién més general de la media poblacional i. En muchos problemas de ingenieria importantes es necesario hacer referencia a una media poblacional 0 tomar decisiones acerca de ella. ‘Aun cuando la media muestral es stil, no comunica toda la informacién acerca de una muestra de datos. La variabilidad o dispersién de los datos puede describirse con la varianza muestral o la desviacién esténdar muestral. Definicién Si xy Xp, ons X, €8 Una muestra de n observaciones, entonces la varianza muestral es : (x; 3 x (1-3) n-1 La desviacién esténdar muestral, s, es la raiz cuadrada positiva de la varianza muestral. Las unidades de las mediciones de la varianza muestral son las unidades originales de la variable al cuadrado, Por tanto, si x se mide en libras-pie, las unidades de la varianza muestral son (libras-pie)?. La desviaci6n esténdar posee la conveniente propiedad de medir la variabili- dad en las unidades originales de la variable de imterés, x. iCémo mide la variabilidad la varianza muestral? Para ver Ia forma en que la varianza muestral mide la dispersién o variabilidad, remitase a la figura 1-4, donde se muestran las desviaciones x,— x para los datos de la fuerza de desconexion del conector. Entre mayor sea la cantidad de variabilidad en los datos de la fuerza de desco- nexién, més grandes serdn en magnitud absoluta algunas de las desviaciones x,~ x . Puesto que Ja suma de las desviaciones x, x siempre es cero, es necesario usar una medida de variabilidad que cambie las desviaciones negativas a cantidades no negativas. Elevar al cuadrado las desvia- ciones es el enfoque utilizado en la varianza muestral. Por consiguiente, si s* es pequeifa, enton- ces hay relativamente poca variabilidad en los datos, pero si s? es grande, la vatiabilidad es relativamente grande. 6 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA o Xu iB ] ei | ee | | | | SS 4 1 | “4 1s Figura 1-4 Forma en que la varianza muestral mide la variabilidad por medio de las desviaciones x,~ x EJEMPLO 1-2 En la tabla 1-1 se muestran las cantidades necesarias para calcular la varianza muestral y la desviaci6n esténdar muestral para los datos de la fuerza de desconexién. Estos datos se grafican en la figura 1-4, El numerador de s* es Sina por lo que la varianza muestral es A =0.2286 bras pie? y la desviaciGn esténdar muestral es 0.2286 48 libras — pie ‘Tabla 1-1. Calculo de los términos para Ja varianza muestral y a desviacién esténdar muestral i ety ak Gi- xP T 126 4 016 2 129 01 0.01 3 134 04 0.16 4 123 07 09 5 136 06 0.36 6 BS 025 1 126 0.16 8 3.1 0.01 04.0 EL METODO DE LA INGENIERIA Y EL PENSAMIENTO ESTADIS Caleulo de st Para encontrar el valor de s? es necesario hacer el célculo de %, de 1 sustracciones y de 1 cuadrados y sumar las operaciones. Si las observaciones originales o las desviaciones x,-x no son mimeros enteros, el manejo de las desviaciones x,—x puede ser tedioso y quizd sea necesa- rio trabajar con varios decimales para asegurar la precisién numérica. Una férmula de célculo ‘més eficiente para la varianza muestral se obtiene de la siguiente manera: Dle-xP YS, (x? +x?-2ax,) Stet 2S n-l n-1 noi 2 y puesto que x=(I/n) >", x;, esta diltima ecuacién se reduce a a4) Notese que Ia ecuacién (1-4) requiere elevar al cuadrado cada x, individual, después elevar al cuadrado la suma de las x, restar (S'x,)'/n de Sx? y, por tltimo, dividir entre n— 1. En ocasiones, esta ecuacién recibe el nombre de método corto para calcular s* (0 s). EJEMPLO 1-3 Se calculardn la varianza y la desviaciGn estindar muestrales utilizando el método corto, ecua- cidn 1-4, De la formula se obtiene = 0.2286 (libras-pie)* s = J0.2286 = 0.48 libras-pie Estos resultados concuerdan exactamente con los que se obtuvieron antes Andloga a la varianza muestral s°, existe una medida de la variabilidad de 1a poblacién llamada varianza poblacional. Se usa la letra griega 0° (sigma cuadrada) para denotar la varianza poblacional. La rafz cuadrada positiva de 6°, 0 6, denotard la desviacién estandar poblacional 8 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA ‘Cuando la poblaci6n es finita y se compone de N valores, la varianza poblacional puede definirse como ¥ 2 Dew) a ee N (1-5) Més adelante se dard una definicién més general de la varianza 0°. Se indicé ya que la ‘media muestral puede usarse como una estimacién de la media poblacional, De manera similar, Ja varianza muestral es una estimacién de la varianza poblacional. Obsérvese que el divisor de la varianza muestral es el tamafio de la muestra menos uno (n= 1), en tanto que el de la varianza poblacional es el tamafio de la poblaci6n N. Si se conociers el valor exacto de la media poblacional 1, entonces la varianza muestral podria encontrarse elevando al cuadrado la desviacién promedio de las observaciones muestrales alrededor de pi. En la practic, casi nunca se conoce el valor de i, por lo que es necesario usar Ia suma del cuadrado de las desviaciones alrededor del promedio muestral x . Sin embargo, las observacio- nes x, tienden a estar més préximas a su promedio, x, que a la media poblacional, ji. Por lo tanto, para compensar este hecho se usa n ~ 1 como divisor, en lugar de n. Si se usara n como divisor en la varianza muestral, se obtendrfa una medida de variabilidad que es, en promedio, cconsistentemente menor que la verdadera varianza poblacional 0, tra forma de visualizar lo anterior es considerar la varianza muestral s? como una medida basada en n ~ 1 grados de libertad. El término grados de libertad resulta del hecho de que las n desviaciones x, - ¥ , x; X, .%,— X siempre suman cero, por lo que al especificar los valores de cualesquiera n~ 1 de estas cantidades autométicamente se determina la nica que ‘queda, Esto se ilustré en la tabla 1-1. Por tanto, s6lo n ~ 1 de las n desviaciones, x,~ x, estén determinadas libremente. ‘Ademés de la varianza muestral y la desviacin estndar muestral, el rango muestral, 1a diferencia entre la observacién mas grande y la mAs pequefia, es una medida ttil de la variabil dad. El rango muestral se define como sigue. ote 6) | Para los datos de la fuerza de desconexi6n, el rango muestral es r= 13.6 ~ 12.3 = 1.3. En general, cuando la variabilidad de los datos muestrales aumenta, el rango muestral se incrementa, El célculo del rango muestral es sencillo, pero ignora toda la informacién de los datos muestrales entre el valor mas pequefio y el més grande. Por ejemplo, las dos muestras 1, 3, 5, 8, 9y 1,5, 5, 5, 9 tienen el mismo rango (r= 8). Sin embargo, la desviaci6n estandar de la primera EL METODO DE LA INGENIERIA Y EL PENSAMIENTO ESTAPISTICO 9 muestra es 5, = 3.35, en tanto que la de la segunda muestra es 3 efecto, menor en la segunda muestra, En ocasiones, cuando el tamaiio de la muestra es pequefto, digamos n <8 0 10, la pérdida de informacién asociada con el rango no es demasiado grave. Por ejemplo, el rango tiene un uso generalizado en el control estadistico de calidad, donde los tamafios de las muestras de 4 0 5 ob- servaciones son bastante comunes. En el capftulo 15 se expondrén algunas de estas aplicaciones. La media, la varianza y la desviaci6n estndar muestrales, asf como los diagramas de pun- tos, son formas simples pero efectivas para resumir los datos. En el capftulo 2 se presentan otros métodos para describir datos. Con frecuencia, los ingenieros también tienen interés en desarrollar un modelo del sistema © proceso que generé los datos. En estos modelos intervienen conceptos de probabilidad que se introducen en el capitulo 3. Se verd que la nocién de una distribucién de probabilidad, como un modelo que describe la variabilidad de un sistema o proceso, es muy importante en el Ambito de Ia ingenierfa. En los capitulos 4 al 6 se explorardn estos conceptos en detalle. .83. La variabilidad es, en 1-1.2_ El pensamiento estadistico La necesidad del pensamiento estadistico surge con frecuencia en la solucién de problemas de ingenierfa. Considérese al ingeniero que disefia el conector. Después de probar los prototipos, 1 sabe que una estimacién razonable de la fuerza de desconexién media es 13.0 libras-pie. Sin embargo, considera que este valor puede resultar muy bajo para la aplicaci6n proyectada, por lo que decide considerar un disefio alternativo con un espesor de Ta pared mayor, 1/8 de pulgada, Se construyen ocho prototipos de este disefio y las mediciones observadas de la fuerza de desco- nexi6n son 12.9, 13.7, 12.8, 13.9, 14.2, 13.2, 13.5 13.1. La media muestral es 13.4 y la des ciGn esténdar muestral es 0.50. Los resultados de las dos muestras se grafican como diagramas de puntos en la figura 1-5. Esta ilustracién y los célculos precedentes dan la impresién de que el aumento del espesor de la pared ha redundado en un incremento en la fuerza de desconexién. Sin embargo, hay algunas preguntas obvias que pueden plantearse. Por ejemplo, ,c6mo sabe~ mos que otra muestra de prototipos no produciré resultados diferentes?, una muestra de ocho rototipos es adecuada para producir resultados confiables? Si los resultados de las pruebas ‘obtenidos hasta el momento se emplean para concluir que al aumentar el espesor de la pared se incrementa la fuerza de desconexi6n, ;cuéles son los riesgos asociados con esta decisién? Por ejemplo, jes posible que el incremento aparente de la fuerza de desconexién observado en los prototipos con un espesor mayor se deba tan s6lo a la variabilidad inherente al sistema y que aumentar el espesor de Ia pieza (y su costo) no tiene en realidad ningtin efecto en Ia fuerza de desconexién? Fuerza de desconexién 4 de pulgada 3 de pole ©. de pulgada Figura 1-5 Diagrama de puntos de la fuerza de desconexién para los dos espesores de la pared. 10 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA En muchos casos s¢ aplican leyes fisicas (tales como la ley de Ohm y la ley de los gases ideales) como apoyo para diseflar productos y procesos. Estamos familiarizados con este razo- namiento que va de leyes generales a casos especificos. Pero también es importante recurrir a un razonamiento que vaya de una serie de mediciones especificas a casos més generales a fin de responder las preguntas anteriores. Este razonamiento es a partit de una muestra (como los ocho conectores) hacia una poblacién (como los conectores que se venderdn a los consumidores). El razonamiento se conoce como inferencia estadistica (véase la figura 1-6). Hist6ricamente, las mediciones se obtenfan de una muestra de habitantes y se generalizaban a una poblaci6n, termi nologia que se ha conservado. Desde luego, el razonamiento que lleva de mediciones de algu- nos objetos a mediciones de todos los objetos pueden resultar en errores (Ilamados errores de muestreo). Sin embargo, si la selecci6n de la muestra se hace de la manera apropiada, estos riesgos pueden cuantificarse y es posible determinar el tamafio adecuado de la muestra. En algunos casos, la muestra se selecciona en realidad de la poblaci6n. La muestra es un subconjunto de la poblacién. Por ejemplo, podria seleccionarse una muestra de tres pastillas de ‘un lote de producci6n de pastillas de silicio en una fabrica de semiconductores. Con base en los datos de la muestra, quiere concluirse algo acerca del lote. Por ejemplo, no se espera que la media de las mediciones de resistividad de la muestra (.x ) sea exactamente igual a la media de Jas mediciones de resistividad del lote (j1). Si embargo, si x tiene un valor alto podria surgir la inquietud de que j1 también sea demasiado alta. La inferencia estadistica es de x ap. En otros casos, Ia poblaci6n todavia no existe, pero podria concebirse como futuros dupli- cados de los objetos de 1a muestra. Para responder las preguntas anteriores, Los ocho conectores prototipo deben ser representativos, en algiin sentido, de los que se venderdn a los consumido- res. En general, los ocho conectores se consideran una muestra de la poblacién compuesta por los conectores que se venderén a los clientes. Desde luego, este andlisis requiere alguna nocién de estabilidad como supuesto adicional. Por ejemplo, podria suponerse que las fuentes de varia- bilidad en la fabricacién de los prototipos (como la temperatura, Ia presiGn y el tiempo de vulcanizacién) serén las mismas que las de los conectores que se venderdn a los consumidores. ‘Al ejemplo de las pastillas-de-lotes se le llama estudio enumerativo. Se usa una muestra para hacer una inferencia sobre la poblaci6n de la que se ha seleccionado la muestra, Al ejemplo del conector se le llama estudio analftico, Se usa una muestra para hacer una inferencia sobre una poblacién futura. Los andlisis estadisticos suelen ser los mismos en ambos casos, pero es evidente que un estudio analitico requiere un supuesto de estabilidad (véase la figura 1-7). = razonamiento Muestra Figura 1-6 La inferencia estadistica 8 uno de los tipos de razonamiento. RECOLECCION DE DATOS DEINGENIERIA = 11 Tiempo Poblacién Poblacién cS & ; Ay ty Estudio Estudio enumerativo analitico Figura 1-7 Estudio enumerativo y estudio analitico RECOLECCION DE DATOS DE INGENIERIA En la secciGn anterior se ilustraron algunos métodos simples para resumir datos. En el ambito de Ja ingenierfa, los datos casi siempre son una muestra que se ha seleccionado de una poblacién. En general, estos datos se recolectan en una de dos formas. La primera forma en que los ingenieros suelen recolectar datos es con un estudio ob- servacional. En esta situaci6n, el proceso o sistema que se esté estudiando solo puede ser observado por el ingeniero, y los datos se obtienen conforme se van presentando. Por ejemplo, supGngase que un ingeniero evalia el desempefio de un proceso de fabricacién para hacer compo- nentes de pléstico por moldeo por inyeccién. E1 ingeniero puede observar el proceso, seleccio- nar componentes conforme se. van fabricando y medir importantes caracteristicas de interés, tales como el espesor de la pared, la contraccién o Ia resistencia de la pieza. También puede medir y registrar variables del proceso potencialmente importantes, tales como la temperatura del moldeo, el contenido de humedad de la materia prima y el tiempo del ciclo. En un estudio observacional, el ingeniero con frecuencia esté interesado en construir un modelo del sistema o proceso. Estos modelos suelen conocerse como modelos empiricos y se introducen ¢ ilustran ‘con mayor detalle en la siguiente seccién. Otra forma en que se obtienen datos observacionales es mediante el andlisis de los datos hist6ricos sobre el sistema o proceso. Por ejemplo, en la fabricacién de semiconductores es muy comiin llevar extensos registros sobre cada lote de pas- Lillas que se ha producido. Estos registros incluirfan datos de prueba de las caracterfsticas fisicas y eléctricas de las pastillas, asf como las condiciones de procesamiento bajo las cuales se produ- jo cada lote de pastillas. Si surgen problemas relacionados con un cambio en una caracteristica eléctrica importante, puede estudiarse la historia del proceso en un esfuerzo por determinar el unto en el tiempo en que ocurrié el cambio y tener un conocimiento profundo de las variables del proceso que podrian ser responsables del mismo. Con frecuencia, estos estudios incluyen series de datos muy extensas y requieren una comprensién s6lida de los principios estadisticos para que el ingeniero tenga éxito, La segunda forma en que se obtienen datos de ingenierfa es a través de un experimento disefiado, En un experimento disefiado, el ingeniero realiza cambios deliberadps 0 intenciona- dos en las variables controlables de un sistema o proceso, observa los datos de los resultados obtenidos del sistema y después hace una inferencia o toma una decisi6n acerca de las variables 12 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA que son responsables de los cambios observados en la eficiencia de los resultados. El ejemplo del conector de nylon de la seccién anterior ilustra un experimento disefiado; es decir, se hizo un cambio deliberado en el espesor de la pared del conector con objeto de descubrir si podia obtenerse © no una mayor fuerza de desconexién. Los experimentos disefiados juegan un papel muy im- portante en los campos de disefio y desarrollo de la ingenierfa, asf como en el mejoramiento de los procesos de fabricaci6n. En general, cuando el disefio y el desarrollo de productos y procesos se hace utilizando experimentos disefiados, éstos tienen un mejor desempefio, mayor confiabilidad y costos generales més bajos. Los experimentos disefiados también juegan un papel crucial para acortar el tiempo requerido en las actividades de ingenieria de disefio y desarrollo. En la seccién 1-4 se ilustrarén varios tipos de experimentos disefiados para el ejemplo del conector. En la seccién 1-1 se introdujeron los conceptos de estudios enumerativos y analiticos. La ‘mayoria de los problemas de ingenierfa requieren estudios analiticos. En ambos tipos de estu- dios pueden obtenerse datos observacionales y datos de experimentos disefiados, pero en la mayoria de los casos incluyen estudios analiticos; es decir, la inferencia 0 decisién derivada del andlisis se refiere al desempefio futuro del sistema o proceso. La habilidad para visualizar y analizar estadisticamente los datos muestrales permitiré res- ponder preguntas acerca del sistema o proceso bajo estudio. Por ejemplo, considérese el proble- ma de elegir el espesor de la pared del conector de nylon. Un enfoque que podrfa emplearse para solucionar este problema seria comparar Ia fuerza de desconexién media para el disefio de 3/32 de pulgada, jLy,q, con la fuerza de desconexién media para el disefio de 1/8 de pulgada, 11). aplicando Ia técnica de la prueba estadistica de hipétesis. En los capitulos 8 y 9 se analiza la prueba de hip6tesis y otras técnicas relacionadas. En general, una hipétesis es una proposicion acerca de algiin aspecto del sistema que es motivo de interés. Por ejemplo, el ingeniero podria interesarse en saber si la fuerza de desconexién media del disefio de 3/32 de pulgada excede la ‘carga méxima tfpica que se espera encontrar en esta aplicaci6n, digamos 12.75 libras-pie. Por tanto, el interés estarfa en probar la hip6tesis de que la fuerza media flyjp excede 12.75. Este se conoce como el problema de probar una hipétesis de una sola muestra. En el capitulo 8 se pre- sentan técnicas para este tipo de problema, Alternativamente, el ingeniero podrfa interesarse cen probar la hipétesis de que el incremento del espesor de la pared de 3/32 a 1/8 de pulgada resulta en un incremento de la fuerza de desconexién media, Desde Iuego, se trata de un estudio analitico; también es un ejemplo del problema de probar una hip6tesis con dos muestras. Los problemas de probar hip6tesis con dos muestras se exponen en el capftulo 9. EJERCICIOS DE LAS SECCIONES 1-1 Y 1-2 1-1. Se midi6 el didmetro interior de ocho ani- pos, en minutos, son los siguientes: 0.19, los forjados para pistones empleados en 0.78, 0.96, 1.31, 2.78, 3.16, 4.15, 4.67, 4.85, motores de automévil. Los datos (en mm) 6.50, 7.35, 8.01, 8.27, 12.06, 31.75, 32.52, son 74,001, 74.003, 74.015, 74.000, 33.91, 36.71 y 72.89. Calcule el promedio 74.005, 74.002, 74.005 y 74.004. Caleu- ‘muestral y la desviacién esténdar muestral. Ie el promedio muestral y Ia desviacién 1-3, Un nimero de Arizona Trend contiene un estindar muestral. Construya un diagra- suplemento que describe los 12 “mejores” ‘ma de puntos y comente los datos. campos de golf del estado. Los yardajes (lon- 1-2, En Applied Life Data Analysis, Wiley, Wayne gitudes) de estos campos son los siguientes: [Nelson presenta el tiempo de falla de un flui- 6 981, 7 099, 6 930, 6 992, 7 518, 7 100, do aislante entre electrodos a 34 KV. Los tiem- 6 935, 7 518, 7 013, 6 800, 7 O41 y 6 890. MODELOS MECANICISTA Y EMPIRICO Caleule e1 promedio muestral y Ia desviacién es- 1-6. {éndar muestral. Construya un diagrama de puntos Ia intensidad solar (watts/m?) en dias diferentes en de los datos. ‘un lugar al sur de Espafia: 562, 869, 708, 775, 775, 1-4. Un articulo del Journal of Structural Engineering 704, 809, 856, 655, 806, 878, 909, 918, 558, 768, (Vol. 115) describe un experimento para probar la 870, 918, 940, 946, 661, 820, 898, 935, 952, 957, resistencia de tubos circulares con tapones solda- (693, 835, 905, 939, 955, 960, 498, 653, 730 y 753, dos en los extremos. Los primeros datos (en kN) son Calcule el promedio muestral y Ia desviacién es- 96, 96, 102, 102, 102, 104, 104, 108, 126, 126, 128, téndar muestra. 128, 140, 156, 160, 160, 164 y 170. Calculeel pro- 1-7. Para los ejercicios del 1-1 al 1-6, comente si los ‘medio muestral y la desviaci6n esténdar muestral. datos resultan de un estudio observacional o de un Construya un diagrama de puntos de los datos. experimento disefiado, 1-5. Un artfculo de Human Factors presents datos so- 1-8. Un niimero de Aviation Week and Space Technology bre el ajuste visual (una funcién del movimiento reporta que durante la Operacién Tormenta det De- del ojo) cuando se identificaba un patrén de man- sierto, los pilotos de los F-117A de la fuerza aérea chas en un monitor cat6dico de alta resoluci6n, CRT. estadounidense realizaron 1 270 misiones de com- Los datos son los siguientes: 36.45, 67.90, 38.77, bate para un total de 6 905 horas. {Cul es la dura- 42.18, 26.72, 50.77, 39.30 y 49.71. Caleule el pro- cién media de una misién de un F-117A durante ‘medio muestral y la desviacién esténdar muestra cesta operacién? ¢Por qué el pardmetro calculado es Construya un diagrama de puntos de los datos. ‘una media poblacional? 1-3. MODELOS MECANICISTA Y EMP{RICO Los modelos juegan un papel importante en el andlisis de précticamente todos los problemas de ingenierfa. Gran parte de la educacién formal de los ingenieros implica el aprendizaje de los modelos relevantes para campos especificos y de las técnicas para aplicar estos modelos en la formulacién y solucién de problemas. Como un ejemplo simple, supSngase que se mide el flujo de corriente en un alambre delgado de cobre. El modelo para este fenémeno podria ser la ley de Ohm Corriente = voltaje/resistencia o bien i=ER a7 Aceste tipo de modelo se le Hama modelo mecanicista, porque se construye a partir del conoci- miento previo del mecanismo fisico bésico que relaciona estas variables. Sin embargo, si este proceso de medicién se leva a cabo mds de una vez, quiz4s en tiempos diferentes, o incluso en dias diferentes, la corriente observada podria diferir ligeramente debido a pequefios cambios 0 Variaciones en los factores que no estén sujetos a un control completo, tales como los cambios en Ja temperatura ambiente, las fluctuaciones en el funcionamiento del medidor, pequefias impure- zas presentes en diferentes sitios del alambre y las variaciones en la fuente de voltaje. Por con- siguiente, un modelo més realista de la corriente observada seria =ER+e (1-8) 14 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA donde € es un término agregado al modelo para tomar en consideracién el hecho de que los valores observados del flujo de corriente no se ajustan exactamente al modelo mecanicista, La € puede visualizarse como un término que incluye los efectos de todas las fuentes de variabilidad no contempladas en el modelo que afectan este sistema. En ocasiones, los ingenieros trabajan con problemas para los que no existe un modelo ‘mecanicista simple 0 del todo conocido que explique el fenémeno, Por ejemplo, supéngase que nos interesa el niimero que expresa el peso molecular medio (M,) de un polimero. Ahora sabe~ ‘mos que M, esté relacionado con la viscosidad de! material (V) y que depende también de la cantidad de catalizador (C) y de la temperatura (7) en el reactor de polimerizacién cuando se fabrica el material. Una relacién entre M, y estas variables seria, por ejemplo, M,=f(V.C,T) (1-9) ‘donde no se conoce la forma de la funci6n f. Quiz4s podrfa desarrollarse un modelo de trabajo a partir de una expansin de primer orden de la serie de Taylor, la cual producirfa un modelo de la forma 1M, = By + B,V + B,C + BsT (1-10) donde las son parémetros desconocidos. Ahora bien, como en el caso de la ley de Ohm, este modelo no describiré exactamente el fenémeno, por lo que seri necesario tomar en considera cin las otras fuentes de variabilidad que puedan afectar el peso molecular agregando otro tér- mino al modelo, de modo que M,=By+B,V+B,C+B,T+e (eu) es el modelo que se usaré para relacionar el peso molecular con las otras tres variables. A un ‘modelo de este tipo se le Hama modelo empfrico; es decir, se aplican en él nuestros conocimien- tos cientificos y de ingenierfa del fendmeno, pero no se desarrolla directamente de nuestra com- prensién tedrica o con base en principios fundamentales del mecanismo subyacente. ara ilustrar estas ideas con un ejemplo espectfico, considérense los datos de la tabla 1-2. Esta tabla contiene los datos sobre tres variables recolectados en una fabrica de semiconductores. En esta fabrica, el semiconductor terminado es alambre adherido en una tablilla. Las variables reportadas son la resistencia al desprendimiento (una medida de la cantidad de fuerza requerida para romper la uni6n), la longitud del alambre y la altura de la matriz. Nos gustarfa encontrar un ‘modelo que relacionara la resistencia al desprendimiento con la longitud del alambre y Ia altura de la matriz, Por desgracia, no hay ningtin mecanismo fisico que pueda aplicarse fécilmente en ‘este caso, por lo que no parece probable que el enfoque de un modelo mecanicista sea de éxito. Obsérvese que se trata de un ejemplo de un estudio observacional (remitase a la seccién 1-2). La figura 1-8 presenta una gréfica tridimensional de las 25 observaciones de la resistencia al desprendimiento, la longitud del alambre y la altura de la matriz. Del examen de esta gréfica se observa que la resistencia al desprendimiento se incrementa cuando tanto la longitud del ‘alambre como Ia altura de la matriz. se incrementan. Ademés, parece razonable pensar que el modelo Resistencia al desprendimiento = By + , (longitud del alambre) + B, (altura de la matriz) + © MODELOS MECANICISTA Y EMPIRICO «15 Tabla 1-2 Datos de la resistencia al desprendimiento de la adherencia del alambre } Nimero de © Resistencia al ‘Longitud i ‘Altura observacion desprendimiento el alambre = de ta matriz 1 9.95 2 50 2 24.45 8 no 3 n 120 4 10 550 5 8 295 6 4 200 1 2 315 8 2 52 9 9 100 10 8 300 u 4 412 2 n 400 B 12 500) 4 2 360 15 4 205 16 4 400 7 20 600) 8 1 585 19 10 540 20 15 250 2 15 290 2 16 510 2B ” 590 24 6 100 25 5 400 serfa apropiado como modelo empfrico para esta relacién. En general, a un modelo empfrico de este tipo se le ama modelo de regresi6n. En los capftulos 10 y 11 se muestra la manera de cconstruir estos modelos y de probar su adecuacién como funciones de aproximacién. Se usaré un método para estimar los parémetros de un modelo de regresi6n, llamado método de mfnimos cuadrados, cuyo origen se remonta al trabajo de Karl Gauss. En esencia, en este método se cescogen los pariimetros del modelo empftico (las B) para minimizar la suma del cuadrado de las, 2 5 £0 bo, = 20 4 = A | a | s o : z 2 16 é Longitud del lambre Figura 1-8 | Grifica tridimensional de los datos del alambre y la resistencia al desprendimiento. 16 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA desprendimiento 2 2 & ee Figura 1-9 Gréfica de los valores predichos de la resistencia al desprendimiento a partir del modelo empirico de la ecuacién (1-12). distancias entre cada punto de los datos y el plano representado por la ecuacién del modelo. Resulta que al aplicar esta técnica a los datos de la tabla 1-2 se obtiene Resistencia al desprendimiento = 2.26 + 2.74 (longitud del alambre) + 0.0125 (altura de la matriz) (1-12) donde el “gorro” o acento circunflejo sobre la resistencia al desprendimiento indica que se trata de una cantidad estimada o predicha. La figura 1-9 es una gréfica de los valores predichos de la resistencia al desprendimiento contra la longitud del alambre y la altura de la matriz, obtenidos de la ecuaci6n 1-12. Obsérvese que los valores predichos estén sobre un plano arriba del espacio longitud del alambre-altura de la matriz. Por la gréfica de los datos de la figura 1-8, este modelo no parece irrazonable. El modelo empirico de la ecuacién 1-12 podrfa usarse para predecir valores de la resistencia al desprendimiento para varias combinaciones de la longitud del alambre y 1a altura de la matriz que sean de interés. En esencia, un ingeniero podrfa usar el modelo empfrico exactamente del ‘mismo modo que se usarfa un modelo mecanicista. 1-4 DISENO DE INVESTIGACIONES EXPERIMENTALES Gran parte de nuestros conocimientos de ingenierfa y ciencias fisico-quimicas se desarrollan mediante la realizaci6n de pruebas 0 experimentacién. Con frecuencia, los ingenieros trabajan cen reas de problemas en las que ninguna teorfa cientffica o de ingenierfa tiene una aplicacién directa o completa, por lo que la experimentacién y la observacién de los datos resultantes constituyen la tinica manera en que puede resolverse el problema. Aun cuando existe una base significativa de teorfa cientifica subyacente en la que podemos apoyarnos para explicar los fenémenos de interés, casi siempre es necesario realizar pruebas o experimentos para confirmar {que la teorfa en realidad es operativa en la situacién o entorno en la que se esté aplicando. El pensamiento estadistico y los métodos estadfsticos juegan un papel importante en la planeaci6n, realizacién y andlisis de los datos de experimentos de ingenieria. En la secci6n 1-1 se traté un breve ejemplo de un ingeniero que investigaba el efecto de aumentar el espesor de la pared de un conector sobre la fuerza de desconexi6n, Recuérdese que cl ingeniero construyé ocho prototipos de cada disefio (3/32 y 1/8 de pulgada), probé cada unidad y calcul6 el promedio muestral y la desviacién esténdar muestral de la fuerza de desco- DISENO DE INVESTIGACIONES EXPERIMENTALES 17 nexién para cada disefio. Se hizo notar que la prueba de hip6tesis estadisticas era un posible ‘marco dentro del cual investigar si un aumento del espesor de la pared en el disefio redundaria en niveles més altos de Ia fuerza de desconexién media. Esta es una ilustracién del uso del pensamiento estadistico como apoyo para el andlisis de los datos de un experimento comparati- vo simple. EI pensamiento estadistico también puede aplicarse a problemas experimentales mas com- plejos. Para ilustrar este punto, reconsidérese el problema del espesor de la pared del conector. ‘Sup6ngase que cuando el conector se ensambla en la aplicacién, primero se sumerge en un adhesivo y luego se valcaniza el ensamblaje aplicéndole calor durante algtin periodo. La fuerza de desconexién se mide en el ensamblaje final. El ingeniero sospecha que ademds del espesor de Ja pared, el tiempo y la temperatura de vulcanizaci6n podrian tener algtin efecto sobre el desem- pefio de] conector. Por lo tanto, es necesario un experimento disefiado que permita investigar el efecto de los tres factores sobre la fuerza de desconexién. ‘Cuando son varios los factores potencialmente importantes, la mejor estrategia de experi- mentaci6n es disefiar algtin tipo de experimento factorial. Un experimento factorial es aquel en el que los factores se hacen variar al mismo tiempo. Para ilustrar este punto, sup6ngase que en e! experimento del conector los tiempos de vulcanizaci6n de interés son 1 y 24 horas y que los niveles de temperatura son 70°F y 100°F. Ahora bien, dado que los tres factores tienen dos ni- veles, un experimento factorial constarfa de las ocho combinaciones de prueba mostradas en las esquinas del cubo de la figura 1-10. Se realizarfan dos ensayos, o réplicas, en cada esquina, dando como resultado un experimento factorial de 16 corridas. Los valores observados de la fuerza de desconexién aparecen entre paréntesis en las esquinas del cubo de la figura 1-10. Obsérvese que en este experimento se utilizan ocho prototipos de 3/32 de pulgada y ocho proto- tipos de 1/8 de pulgada, el mismo nimero empleado en el estudio comparativo simple de la secci6n 1-1, pero ahora se estén investigando tres factores. En general, los experimentos factoriales son la manera més eficiente de estudiar los efectos conjuntos de varios factores. Es posible sacar interesantes conclusiones tentativas de este experimento, Primero, compa- rese la fuerza de desconexién promedio de los ocho prototipos de 3/32 de pulgada con la fuerza de desconexién promedio de los ocho prototipos de 1/8 de pulgada (estos son los promedios de las ocho corridas de la cara derecha y la cara izquierda del cubo de la figura 1-10, respectiva- 148 151 (146, 150) (049,153) B00 36 | (125,135) | [033.139 | « | i i | aa 14d E (129,133). 039,143) le ns . Espesor de la pared (pole) 129 136 (126,132) (34,138) Figura 1-10 El experimento factorial para el problema del espesor de la pared del conector. 18 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA mente), 0 14.1 ~ 13.45 = 0.65. Por tanto, al incrementarse el espesor de la pared de 3/32 a 1/8 de pulgada, la fuerza de desconexién promedio se incrementa en 0.65 libras-pie. Siguiente, para medir el efecto del incremento del tiempo de vulcanizacién, compérese el promedio de las ocho corridas en la cara posterior del cubo (donde el tiempo = 24 h) con el promedio de las ocho co- rridas de la cara frontal (donde el tiempo = 1 h), 0 14.275 ~ 13.275 = 1. El efecto de aumentar el tiempo de vulcanizacién de 1 a 24 horas es un incremento de la fuerza de desconexién promedio de 1 libra-pie; es decir, el tiempo de vulcanizaci6n aparentemente tiene un efecto que es mayor que el efecto de incrementar el espesor de la pared. El efecto de la temperatura de vulcanizaci6n puede evaluarse comparando el promedio de las ocho corridas de la cara superior del cubo (donde la temperatura = 100°F) con el promedio de las ocho corridas de la cara inferior (donde la temperatura = 70°F), o 14.125 — 13.425 = 0.7. Por tanto, el efecto de aumentar la temperatura de vulcanizacién es un incremento de la fuerza de desconexién promedio de 0.7 libras-pie. Por tanto, si el objetivo del ingeniero es diseflar un conector con una fuerza de desconexién alta, aparentemente existen varias alternativas, como incrementar el espesor de la pared y utilizar las condiciones de vulcanizacién “estindares” de 1h y 70°F o bien utilizar el espesor de la pared original de 3/32 de pulgada, pero especificando un tiempo de vulcanizacién més largo y una temperatura de vulcanizacién més alta. Existe una interesante relaci6n entre el tiempo y la temperatura de vulcanizacién que puede verse examinando la gréfica de la figura 1-11. Esta gréfica se construyé calculando la fuerza de desconexién promedio con las cuatro diferentes combinaciones del tiempo y la temperatura, graficando estos promedios contra el tiempo y, por tltimo, uniendo con Ifneas rectas los puntos que representan los dos niveles de temperatura. La pendiente de cada una de estas rectas repre~ senta el efecto del tiempo de vuleanizaciGn sobre la fuerza de desconexién. Obsérvese que las pendientes de estas dos rectas no parecen ser iguales, indicando que el efecto del tiempo de vuleanizacién es diferente para los dos valores de la temperatura de vuleanizacién, Este es un ejemplo de una interaccién entre dos factores. La interpretacién de esta interacci6n es bastante directa; si se usa el tiempo de vulcanizacién esténdar (1 h), la temperatura de vulcanizacién tiene un efecto reducido, pero si se usa el tiempo de vulcanizacién mas largo (24 h), el aumento ‘Tiempo Temperatura _ Fuerza promedio 1520 Th 70°F 13.5 Th 100% 1330 2h 10°F 60 1483 2h OF 143s a7 Pea & oo 5 fo 7 13 : — | ts - 1297 | Temp. = 70°F ns | | th 2h Tiempo Figura 1-11 La interaccién de dos factores entre el tiempo de vulcanizaci6n y la temperatura de vulca- nizacién, DISENO DE INVESTIGACIONES EXPERIMENTALES 19 ‘Tipo de adhesivo ‘Temperatura | oped | at | taper dep oto) Figura 1-12. Experimento con cuatro factores para el problema del espesor de la pared del conector. de la temperatura de vulcanizaci6n tiene un efecto considerable sobre la fuerza de desconexién promedio. Las interacciones ocurren con frecuencia en sistemas fisicos y qufmicos, y los expe- rimentos factoriales son la tinica manera de investigar sus efectos. De hecho, si existen interacciones y no se usa la estrategia experimental factorial, pueden obtenerse resultados inco- rrectos 0 engafiosos. Es sencillo ampliar la estrategia factorial para un nfimero mayor de factores. Supéngase que 1 ingeniero quiere considerar un cuarto factor, el tipo de adhesivo. Hay dos tipos: el adhesivo esténdar y uno de reciente introduccién, En la figura 1-12 se ilustra la forma en que podrfan investigarse los cuatro factores —el espesor de la pared, el tiempo de vulcanizacién, la tempera~ tura de vulcanizacién y el tipo de adhesivo— en un diseffo factorial. Puesto que los cuatro factores siguen teniendo dos niveles, el disefio experimental todavia puede representarse geométricamente como un cubo (se trata en realidad de un hipercubo). Obsérvese que, como en cualquier disefio factorial, se prueban todas las combinaciones posibles de los cuatro factores, El experimento requiere 16 ensayos. En general, si hay k factores presentes y cada uno de ellos tiene dos niveles, un disefio experimental requerir& 2 corridas. Por ejemplo, con k= 4, el disefio 2* de la figura 1-12 requie~ Te 16 pruebas. Obviamente, conforme el nimero de factores aumenta, el ntimero de ensayos requeridos en un experimento factorial se incrementa con rapidez; por ejemplo, ocho factores ccon dos niveles cada uno requerirfa 256 ensayos. Esto pronto deja de ser factible desde el punto de vista del tiempo y otros recursos. Por fortuna, cuando hay entre cuatro y cinco 0 més factores, por lo general no es necesario probar todas las combinaciones posibles de los niveles de los factores. Un experimento factorial fraceionado es una variacién del arreglo factorial basico en el que s6lo se prueba realmente un subconjunto de las combinaciones de los factores. En la ‘Tipo de adhesive by Espesor de la pared (pulg) Figura 1-13 Experimento factorial fraccionado para el problema del espesor de la pared del conector. 20 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA figura 1-13 se muestra un disefio experimental factorial fraccionado para la versién con cuatro factores del experimento del conector. Las combinaciones de prueba que aparecen encerradas ‘en un circulo en esta figura son las tinicas combinaciones de prueba que necesitan correrse. Este disefio experimental s6lo requiere ocho corridas en vez de las 16 originales; por consiguiente, se Hamarfa de media fraccién. Este es un excelente disefio experimental para estudiar los cuatro factores, Proporcionaré informacién adecuada acerca de los efectos individuales de los cua- tro factores, asf como cierta informacién acerca de la manera en que interactéan, Los experimentos factoriales y factoriales fraccionados son usados ampliamente por inge- nieros y cientificos en el campo de la investigaci6n y el desarrollo industrial, donde se disefian y desarrollan nuevas tecnologfas, productos y procesos, y donde se mejoran los productos y procesos existentes. Dada la enorme cantidad de trabajos de ingenierfa donde interviene la rea~ lizaci6n de pruebas y la experimentaci6n, es fundamental que todos los ingenieros comprendan los principios bésicos de la planeacién eficiente y eficaz, de experimentos. Estos principios se discuten en el capitulo 12. El capftulo 13 se dedica a los factoriales y los factoriales fracciona- dos que se han introducido aqui, 1-5 OBSERVACION DE PROCESOS EN EL TIEMPO. Siempre que se recolectan datos en el tiempo es importante graficarlos en esta dimensi6n. Los fenémenos que podrfan afectar el sistema o proceso con frecuencia se hacen més evidentes en una gréfica orientada en el tiempo y el concepto de estabilidad puede juzgarse mejor. La figura 1-14 es un diagrama de puntos de las lecturas de la concentracién tomadas perié- dicamente en un proceso quimico. La gran variaci6n que se observa en el diagrama de puntos indica un posible problema, pero el diagrama no ayuda a explicar la razén de la variacién. Debido a que los datos se recolectan en el tiempo, en la figura 1-15 se grafican en el tiempo. En la gréfica es visible un movimiento en el nivel medio del proceso y puede obtenerse una estima- cin del tiempo en que ocurre el corrimiento. El gurd de la calidad Edward Deming destacé la importancia de entender la naturaleza de la variacién en el tiempo. Realizé un experimento en el que intentaba arrojar unas canicas tan cerca como fuera posible de un blanco sobre una mesa. Utilizé un embudo montado en un aro con pedestal y las canicas se dejaban caer en el embudo (véase la figura 1-16). El embudo se alineé lo mAs cerca posible con el centro del blanco. Después Deming utilizé dos estrategias diferentes para operar el proceso, 1) Nunca cambiaba de posicién el embudo. Simplemente dejaba caer una canica tras otra y registraba la distancia del blanco. 2) Dejaba caer Ja primera canica y registraba su posicién en relaci6n con el blanco. Después movfa el embudo una distan- cia igual pero en direcci6n opuesta en un intento por compensar el error. Repetta el mismo ajuste después de dejar caer cada canica. g5 84087580 Concentracién Figura 1-14 El diagrama de puntos ilustra la variacién, pero no identifica el problema, COBSERVACION DE PROCESOS EN EL TIEMPO, 2] Concentracién 80 10 20 30 Namen de observacién igura 1-15 Una gréfica de la concentracién contra el tiempo. Después de llevar a cabo las dos estrategias, Deming observ6 que la varianza de la distancia del blanco para la estrategia 2 era aproximadamente dos veces mayor que para la estrategia 1. Los ajustes del embudo incrementaron las desviaciones del blanco. La explicacién es que el error (la desviacién de la posici6n de la canica respecto del blanco) para una canica no propor- ciona informacién sobre el error que ocurrird en la canica siguiente. Por consiguiente, los ajus- tes del embudo no disminuyen los errores futuros, Mais bien, tienden a alejar mas el embudo del blanco, Este interesante experimento indica que los ajustes de un proceso basado en perturbaciones aleatorias en realidad pueden incrementar la variacién del proceso. Este hecho se conoce como sobrecontrol 0 corrupeién. Los ajustes s6lo deberdn aplicarse para compensar un cambio no aleatorio en el proceso; entonces pueden ayudar. Es posible usar una simulacién de computado- ra para poner de manifiesto las ensefianzas del experimento del embudo, En Ja figura 1-174 se muestra una gréfica en el tiempo de 50 mediciones (denotadas por y) de un proceso en el que ‘inicamente estan presentes perturbaciones aleatorias. El valor al que se quiere Hegar en el pro- eso es 10 unidades. En la figura 1-17 se muestran los mismos datos después de aplicar ajustes a Ja media del proceso en un intento por producir datos més préximos al valor que quiere alcanzarse. Cada ajuste es igual y en la direcci6n opuesta a la desviacién mostrada por la medi- cién anterior respecto del valor al que quiere legarse. Por ejemplo, cuando la medicién es 11 (una unidad arriba del valor que quiere alcanzarse), la media se reduce una unidad antes de generar Ia medicidn siguiente. EI sobrecontrol ha incrementado las desviaciones respecto del valor que quiere alcanzarse. = / 0 ey Blanco Canicas Figura 1-16 — Experimento del embudo de Deming. 22 EL PAPEL DE LA ESTADISTICA EN LA INGENIERIA, y 10 9 8 1 6 Le 10 20 0 0 30 [Niimero de observacién Figura 1-174 Datos del proceso que incluye tinicamente perturbaciones aleatorias En la figura 1-18a se muestran los mismos datos de la figura 1-17a, excepto porque las mediciones después de la observacién nimero 25 se incrementan dos unidades para simular el efecto de un corrimiento en la media del proceso. Cuando hay un corrimiento auténtico en la media de un proceso, un ajuste puede ser conveniente. En la figura 1-18b se muestran los datos obtenidos cuando se aplica un ajuste (un decremento de dos unidades) a la media después de que se detecta el corrimiento (en la observacién 28). Nétese que con este ajuste disminuyen las desviaciones del valor que quiere aleanzarse. La cuestién de cudndo aplicar un ajuste (y de qué magnitud) empieza con la comprensién de los tipos de variacién que afectan un proceso. Un diagrama de control es un recurso invaluable para examinar la variabilidad en datos orientados en el tiempo. En la figura 1-19 se presenta el diagrama de control de los datos de la concentracién del proceso quimico de la figura 1-15. La Iinea central de\ diagrama de control es tan s6lo el promedio de las mediciones de la concentra- cién de las 20 primeras muestras (x = 91.5 g/l) cuando el proceso es estable. El limite superior de control y el limite inferior de conifol son wn pat de limites derivados estadisticamente que refle- {jan la variabilidad inherente 0 natural del proceso. Estos limites se localizan tres desviaciones a hrC— De 10 20 30 40 30 [Niimero de observacion Figura 1-175 Los ajustes aplicados a las perturbaciones aleatorias introducen un sobrecontrol del proceso e incrementan las desviaciones respecto del valor que quiere alcanzarse. OBSERVACION DE PROCESOS EN EL TIEMPO 23, Liiitiniiiiiiiriiiis) 10 20 30 40 50 \Niimero de observacién Figura 1-184 La media del proceso tiene un corrimiento (dos unidades hacia arriba) después de la observaciGn nimero 25, estindar de los valores de la concentracién arriba y abajo de la Ifnea central. Si el proceso esti operando como deberfa, sin ninguna fuente externa de variabilidad presente en el sistema, las mediciones de la concentraci6n deberén fluctuar alrededor de la Ifnea central y la mayorfa de ellas deberén quedar entre los limites de control. En el diagrama de control de la figura 1-19, el marco de referencia visual que proporcionan 1a linea central y los limites de control indica que algiin trastomo o perturbacién ha incidido en el proceso cerca de la muestra 20, ya que todas las observaciones posteriores se encuentran abajo de la linea central y dos de ellas de hecho estén abajo del Ifmite inferior de control. Esta es una sefial muy clara de que se requiere una acci6n correctiva en el proceso. Si es posible encontrar y eliminar la causa fundamental de este trastorno, el desempefio del proceso podré mejorarse considerablemente. Los diagramas de control son una aplicacién muy importante de la estadfstica para monitorear, controlar y mejorar un proceso. La rama de la estadfstica que hace uso de los diagramas de con- trol se llama control estadistico de procesos o SPC (Statistical Process Control). En el capftulo 15 se expondrén el SPC y los diagramas de control. ‘Se detecta un comrimiento a en la medida del proce 10 20 Naimero de observacion Figura 1-185 Se detecta un corrimiento en la media del proceso en la observacién nimero 28 y las mediciones subsecuentes se decrementan dos unidades. 24 ELPAPEL Concentracién Figura 1-19 19, 1-10, 1. DE LA ESTADISTICA EN LA INGENIERIA Limite superior de control = 100.5 90 80 a 1520 1Niimero de observacion Ejercicios complementarios Prevenir la propagaciGn de las fisuras por fatiga en las estructuras aeronéuticas es un clerento importante de la seguridad en la avi ci6n, Un estudio de ingenieria para investi- {gar las fisuras por fatiga en n = 9 secciones de un ala sometidas a cargas por unidad de superficie ciclicas, report6 fisuras con las si- uientes longitudes (en mm): 2.13, 2.96, 3.02, 1.82, 1.15, 1.37, 2.04, 2.47, 2.60, a) Calcule 1a media muestra. b) Calcule la varianza muestral y 1a des- ViaciGn estindar muestral ©) Haga un diagrama de puntos de los datos. Considérense los datos de Ia intensidad s0- Jar del ejercicio 1-6. Haga un diagrama de puntos de estos datos. Indique dénde se 1o- caliza Ja media muestral en este diagrama. Proponga una interpretaciOn préctica de Ja media muestral. En el ejercicio 1-5 se describen los datos de un articulo de Human Factors sobre el aco- ‘modamiento visual obtenidos en un experi- mento con una pantalla catédica de alta resoluci6n, CRT. 2) Construya un diagrame de puntos de es- tos datos. b)_ Enel articulo también se reportaron los, datos de un segundo experimento utii- Diagrama de control para los datos de 1a concentracién del proceso quimico. zando una pantalla de baja resolucién, Estos son 8.85, 35.80, 26.53, 64.63, 9.00, 15.38, 8.14 y 8.24, Haga un diagra- rma de puntos para esta segunda muestra yy compérelo con el dela primera muestra. {Qué puede concluirse acerca de Ta reso- luci6n de la pantalla catédica en esta si- ‘tuacién? 1-12. Un operador hace ocho mediciones del pH de una solucién utilizando el mismo instru- ‘mento, Obtiene los siguientes datos: 7.15,7.20, 7.18, 7.19, 7.21, 7.20, 7.16 y 718. ) Caleule la media muestra. b) Calcule la varianza muestral y Ta des- viacién estindar muestral. {Cuéles son las principales fuentes de -variabilidad en este experimento? En un articulo de Journal of Aircraft se des- cribe el céleulo de los coeficientes de retardo de la superficie aerodindmica NASA 0012. Se utilizaron algoritmos de eélculo diferentes para M,, = 0.7 con los resultados siguien- tes (los coeficientes de retardo de la superfi- cie aerodinémica estén en unidades de conteo de retardo acrodinémico; es decir, 1 conteo es ‘equivalente a un coeficiente de retardo de la superficie aerodinémica de 0.0001): 79, 100, 74, 83, 81, 85, 82, 80 y 84, Calcule la media ° 1-13. auestral, Ia varianza muestral y ta des cidn estindar muestra, y haga un diagrama de puntos, Los datos siguientes corresponden a las ten peraturas conjuntas (*F) de Tos anillos sells (O-rings) para cadu encendido de prucba lanzamiento real del motor del trinsborda- dorespacial (de Presidential Commission on the Space Shuttle Challenger Accident, vol 1, pp. 129-131): 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, $8, 68, 60, 67, 72, 73,70, OBSERVACION DE PROCESOS EN EL TIEMPO. 25 57, 63, 10, 78, 52, 67, 53, 16, 79, 75, 76, 58, 31. a) Calcule Ia media muestral y la desviacion cestindar muestral b) Construya un diagrama de puntos de los datos de las temperaturas, 4) Omita la observacion més pequeia (31°F) y ealcule de nuevo las eantidades del inciso 4), Comente los resultados. {Qué tan “dife- rentes” son las otras temperaturas de este Gi- timo valor? 67, 75, 61, 70, 81, 1-15. 1.16, 147. 1-18. EJERCICIOS PARA DESARROLLAR EL INTELECTO CConsidere los datos de la superficie aerodindmica del ejercicio 1-13. Reste 30 de cada valor y des- pués multiplique por 10 las cantidades resultan- tes, Calcule ahora s? para los nuevos datos {Cémo se relaciona esta cantidad con la s? de los datos originales? Explique por que. Considere Ia cantidad 21(%1- 4)" , 4Con qué valor de a se minimiza esta cantidad? Usando los resultados gel ejercicio de las dos cantidades 2y (xx)? y 16, goudl oy? (i) serd menor, considerando que #1? Codificacién de los datos. Seay, = a + bx, + 2, ss n, donde a y b son constantes 1-20, 1. Una muestra de mediciones de la tempe- diferentes de cero, Encuentre la relacién entre ¥ y J. yentres,y 5, ratura en un homo produjo un promedio :vestral (*F) de 835.00 y una desviacién esténdar muestral de 10.5. Utilizando los resultados del ejercicio 1-18, ;cudles son cl promedio muestral y la desviacién cestndar muestral expresados en °C? Considere 1a muestra x), Xp) oy X, CO media muestral % y desviaci6n estindar rmuestral s. Sea z,= (4;~ is, i= 1,2, 1 n. {Cues son los valores de la media rmuestral y la desviaci6n esténdar muestra de las 23? 294 muestra Inferencia estadistica para una sola PLAN GENERAL DEL CAPiTULO 8.1 PRUEBA DE HIPOTESIS 841.1 Hipétesis estadisticas 8.1.2 Pruebas de hipétesis estadisticas 84.3. Hipétesis de una y dos colas 8.1.4 Procedimiento general de las pruebas de hipétesis 82° INFERENCIA SOBRE LA MEDIA DE UNA POBLACION, VARIANZA CONOCIDA 8.2.1 Pruebas de hipétesis sobre la media 8.2.2 Valores P en las pruebas de hipétesis 82,3. Error tipo II y eleccién del tamafio de la muestra Prueba para muestras grandes Algunos comentarios précticos sobre las pruebas de hipotesis Intervalo de confanca para la media Método general para deducir un intervalo de confianza 8.2.8 Intervalos de confianza bootstrap (cargador inicil) 83. INFERENCIA SOBRE LA MEDIA DE UNA POBLACION, VARIANZA DESCONOCIDA 83.1 Prucbas de hipétesis sobre la media 83.2 Valor P para una prueba ¢ 824 82.5 82.6 82.7 84 85 86 87 88 83.3. Solucién de computadora 83.4 Eleccién del tamafio de la muestra 83.5. Intervalo de confianza sobre Ia media INFERENCIA SOBRE LA VARIANZA DE UNA POBLACION NORMAL 84.1 Pruebas de hipotesis sobre la vvarianza de una poblacion normal Error By eleccién del tamafio de la muestra Intervalo de confianza sobre la varianza de una poblacién normal INFERENCIA SOBRE UNA PROPORCION DE UNA POBLACION 85.1 Prucbas de hipotesis sobre una proporcién binomial 85.2 Error tipo II eleccién del tamano de Ia muestra 85.3 Intervalo de confianza sobre una proporcién binomial ‘TABLA DE RESUMEN PARA. PROCEDIMIENTOS DE INFERENCIA PARA UNA SOLA MUESTRA PRUEBA DE LA BONDAD DEL AJUSTE PRUEBAS DE TABLAS DE CONTINGENCIA B42 84.3 PRUEBA DE HIPOTESIS 295 8-1 PRUEBA DE HIPOTESIS 8-1.1 Hipétesis estadisticas En el capitulo anterior se explicé cémo estimar un pardmetro a partir de datos muestrales. Sin embargo, en muchos problemas de ingenierfa es necesario decidir si se acepta o se rechaza un enunciado acerca de algin parémetro. Al enunciado se le lama hip6tesis, y al procedimiento ara tomar decisiones acerca de la hipétesis se le lama prueba de hip6tesis. Sc trata de uno de Jos aspectos més titiles de la inferencia estadistica, ya que muchos problemas de toma de deci- siones, pruebas o experimentos en el mundo de la ingenierfa pueden formularse como proble- mas de prueba de hip6tesis. Los autores del libro nos inclinamos por considerar la prueba estadistica de hipstesis como la etapa de andlisis de datos de un experimento comparativo, en el cual al ingeniero le interesa comparar, por ejemplo, la media de una poblacién con un valor dado. Estos experimentos comparativos simples se encuentran con frecuencia en la préctica y proporcionan bases sélidas para los problemas de disefio experimental de mayor compl que se estudian en los capftulos 12 y 13, En este capitulo se discuten los experimentos compara- tivos en los que interviene una sola poblacién, y la atencién se centra en la prueba de hipdtesis referentes a los parémetros de la poblacién. Se presenta ahora una definicién formal de hipétesis estadistic: | Und hipétesis estadtstica es +, poblaciones. a de los pardmetros de una o més Puesto que se han venido usando distribuciones de probabilidad para representar poblacio- nes, una hip6tesis estadistica también podrfa considerarse como un enunciado acerca de la dis- wibucién de probabilidad de una variable aleatoria. En la hip6tesis, por lo general interviene uno o més parémetros de esta distribucién. Por ejemplo, suponga que se tiene interés en la rapidez de combusti6n del propulsor s6lido utilizado para impulsar los sistemas de expulsiGn de la tripulacién de un avién. Entonces, la rapidez. de combustién es una variable aleatoria que puede describirse con una distribucién de probabilidad, Suponga que el interés se enfoca en Ia media de la rapidez de combustién (uno de los parémetros de esta distribucién). Espectficamente, quiere decidirse si la media de la rapi- dez de combusti6n es 50 cm/s 0 no. Esto puede expresarse formalmente como Hg: w= S0emis Hy we S0cms (8-1) Alenunciado Hy: = 50 ems de la ecuacién 8-1 se le Ilama la hip6tesis nula, y al enuncia- do H): 1 # 50 cm/s se le llama la hipétesis alternativa. Puesto que la hipétesis alternativa ‘specifica el valor de jt que podria ser mayor o bien menor que 50 cm/s, se le llama hipétesis 296 INFERENCIA ESTADISTICA PARA UNA SOLA MUESTRA alternativa de dos colas. En algunas situaciones, querrfa formularse una hipétesis alternativa de una cola, como en Hy:w=S0cm/s Hy: w= S0cm/s Hyiw50cm/s (82) Es importante recordar que las hipétesis son siempre enunciados acerca de la poblacién o la distribucién bajo estudio, no enunciados acerca de la muestra. El valor del pardmetro poblacional cespecificado en la hip6tesis nula (50 cm/s en el ejemplo anterior) se determina por lo general en una de tres formas. Primera, puede ser el resultado de la experiencia pasada, del conocimiento del proceso 0, incluso, de pruebas o experimentos anteriores. Asf, el objetivo de la prueba de hipétesis suele ser determinar si el valor del parémetro ha sufrido cambios. Segunda, este valor puede determinarse a partir de una teoria 0 modelo del proceso bajo estudio. En este caso, el “objetivo de la prueba de hip6tesis es verificar la teorfa 0 el modelo. Una tercera situacién surge cuando el valor del pardmetro poblacional es resultado de consideraciones externas, como espe- cificaciones de disefio 0 de ingenierfa, 0 de obligaciones contractuales. En este caso, por lo general el objetivo de la prueba de hipétesis es una prueba de conformidad. ‘A.un proceso que lleva a una decisi6n acerca de una hip6tesis particular se le llama prueba de una hipétesis. Los procedimientos de prueba de hipétesis se basan en el uso de la informa- ci6n contenida en una muestra aleatoria de la poblacién de interés. Si esta informacién es con- sistente con la hip6tesis, entonces se concluiré que la hipétesis es verdadera; sin embargo, si esta informacién no es consistente con la hip6tesis, se concluiré que la hipétesis es falsa. Se hace hincapié en que el cardcter verdadero o falso de una hip6tesis particular nunca puede conocerse con toda certeza, a menos que pueda examinarse la poblacién completa, lo cual suele ser impo- sible en la mayorfa de las situaciones précticas. Por lo tanto, el procedimiento para la prueba de hipétesis deberd realizarse teniendo en mente la probabilidad de llegar a una conclusién in- correcta. La estructura de los problemas de prueba de hipétesis es idéntica en todas las aplicaciones {que se consideran en este texto. La hipotesis nula es la hip6tesis que quiere probarse. El rechazo de la hip6tesis nula lleva siempre a aceptar Ia hip6tesis alternativa. En el tratamiento que se aplica aquf para la prueba de hipétesis, Ia hip6tesis nula se enunciard especificando siempre un valor exacto del pardmetro (como en el enunciado Hy: Ht = 50 emis de la ecuacién 8-1). En la hipétesis alternativa siempre se permitiré que el parémetro tome varios valores (como en el enunciado H;: [t # 50 cm/s de la ecuaci6n 8-1). Probar la hip6tesis implica tomar una muestra aleatoria, calcular un estadistico de prueba de los datos muestrales, y utilizar después el esta- distico de prueba para tomar una decisién acerca de la hipétesis nula. 8-1.2 Pruebas de hipstesis estadisticas Para ilustrar los conceptos generales, considérese el problema de la rapidez. de combusti6n de la carga propulsora que se introdujo antes. La hipétesis nula es que la rapidez de combustién media es 50 cml, y la alterna es que no es igual a 50 cm/s. Es decir, quiere probarse PRUEBA DE HIPOTESIS 297 Hy: =50cm/s Hy: #500m/s Suponga que se prueba una muestra den = 10 observaciones y se obtiene la media muestral de la rapidez. de combustién. La media muestral es una estimacién de la verdadera media poblacional jt. Un valor de la media muestral x que esté cerca del valor hipotético jt = 50 cm/s es evidencia de que la verdadera media j1 es en realidad 50 cvs; es decir, dicha evidencia apoya la hipétesis nula Hy, Por otra parte, una media muestral que difiera considerablemente de 50 cm/s es evidencia en favor de la hip6tesis alternativa H. Por tanto, en este caso la media muestral es el estadistico de la prueba. La media muestral puede tomar muchos valores diferentes. Suponga que si 48.5 $%< 51.5, no se rechazaré la hip6tesis nula Hy: H = 50, y cuando ¥< 48.5 0 bien ¥> 51.5, se recha-zaré la hipétesis nula en favor de la hipétesis alternativa H,: i. # 50. Esto se ilustra en Ja figura 8-1. Los valores de ¥ que son menores que 48.5 y mayores que 51.5 constituyen la regién critica de la prueba, en tanto que todos los valores que estén en el intervalo 48.5 $¥< 51.5 forman una regiGn en la que no la hip6tesis nula no puede rechazarse, Por convencién, a ésta suele llamérsele Ja regién de aceptaci6n. A los limites entre las regiones criticas y la regiGn de aceptacién se les Tama los valores eriticos. En el ejemplo anterior los valores criticos son 48.5 y 51.5. Se acos- tumbra enunciar las conclusiones en términos de la hip6tesis nula H,, Por lo tanto, se rechaza H, en favor de H, cuando el estadfstico de prueba cae en la regién critica, mientras que en caso contrario no puede rechazarse H,. Este procedimiento de decisin puede evar a una de dos conclusiones incorrectas. Por ejemplo, la verdadera media de la rapidez. de combustién de la carga propulsora podria ser igual 50 cm/s. Sin embargo, para las observaciones de la carga propulsora seleccionadas al azar que se prueban, pudo haberse encontrado un valor del estadistico de prueba X que caiga en la region critica. En tal caso, se rechazaria la hipétesis nula Hy en favor de la hipétesis alternativa H, cuando, de hecho, Hy en realidad es verdadera. A este tipo de conclusién incorrecta se le llama error tipo I. El error tipo I se define como el rechazo de la hip6tesis nula H, cuando ésta es verdadera. oi ope Se rechaza H, | No puede rechazarse H,| Se rechaza H, #50 emis = 50 emis #50 cm/s << - a > 48.5 w=50 S15 Figura 8-1 Criterios de decisién para probar H,: \t = 50 cm/s ‘contra H,: .# 50 emis. 298 INFERENCIA ESTADISTICA PARA UNA SOLA MUESTRA ‘Suponga ahora que la verdadera media de la velocidad de combustién es diferente de 50 cm/s, no obstante que la media muestral x cae en la regiGn de aceptacin. En este caso no se rechazaria H cuando es falsa. A este tipo de conclusién incorrecta se le llama error tipo II. Por tanto, cuando se prueba cualquier hipétesis estadistica, cuatro situaciones diferentes deter- minan si la decisiGn final es correcta o errénea. En la tabla 8-1 se presentan estas situaciones. Debido a que la decisiOn que se tome est basada en variables aleatorias, pueden asociarse probabilidades con los errores tipo I y tipo Il de la tabla 8-1. La probabilidad de incurrir en un error tipo I se denota por la letra griega a. Es decir, 0.= Plerror tipo 1) = P(rechazar Hy cuando Hy es verdadera) (83) En ocasiones a la probabilidad del error tipo I se le lama el nivel de significacién o amplitud de la prueba, En el ejemplo de la rapidez. de combusti6n de la carga propulsora, ocurriré un error tipo I cuando ¥ > 51.5 0 cuando X< 48.5, dado que la verdadera media de la rapidez. de combus- tidn es = 50 cm/s. Suponga que la desviaci6n esténdar de la rapidez de combusti6n es 6 = 2.5 cm/s y que la rapidez de combustién tiene una distribucién para la que se cumplen las condi nes det teorema del Ifmite central, de tal modo que la distribucién de a media muestral es aproximadamente normal con media jt = 50 y desviacién estindar o//n = 2.5; 1/10 = 0.79. La probabilidad de incurrir en un error tipo I (es decir, el nivel de significacién de la prueba) es ‘igual ala suma de las dreas que se han sombreado en las colas de la distribucién normal de la figura 8-2. Esta probabilidad puede encontrarse como a= P(X < 48.5 cuando p = 50) + P(X > 51.5 cuando 0) Los valores z que corresponden a los valores criticos 48.5 y 51.5 son 1, = 485250 0.79 1.90 Tal 8-1 _Decisiones en la prueba de hipétesis Decisién Hyes verdadera Hy es falsa No puede rechazarse Hy no hay error error tipo Il Se rechaza Hy error tipo I no hay error PRUEBA DE HIPOTESIS 299 0/2 = 0.0288 Figura 8-2 La region yn= 10. y Por Jo tanto, a= P(Z<~1.90) + P(Z> 1.90) = 0.0288 + 0.0288 0.0576 Esto implica que 5.76% de todas las muestras aleatorias Hevarfan al rechazo de Ja hipétesis Hy: = 50 cm/s cuando la verdadera media de la rapidez de combustiGn es en realidad 50 cm/s. Al examinar la figura 8-2, obsérvese que o puede reducirse ampliando la regién de acepta- cién, Por ejemplo, si los valores criticos se hacen 48 y 52, el valor de 0. es . 50 52-50 ann(2< 0.79 } oz >" 0.79 ) = P(Z<-2.53) + P(Z > 2.53) 0.0057 + 0.0057 o.0114 ‘También podria reducirse a incrementando el tamafio de 1a muestra. Sin = 16, entonces o/\n =2.5//16 = 0.625, y al utilizar la regi6n critica original de la figura 8-1 se encuentra 2, = 485-50 "0.625

También podría gustarte