Está en la página 1de 32

HERRAMIENTAS ESTADSTICAS PARA LA CALIDAD, en: Juran J. M.

, Juran On
Leadership For Quality, Editorial Free Press USA 2003,

Estadstica es la recoleccin, organizacin, anlisis, interpretacin y presentacin de datos.

El arsenal

de conocimientos sobre los mtodos estadsticos es una herramienta esencial para el enfoque moderno de la calidad. Sin estos conocimientos, llegar a alguna conclusin sobre los datos se convierte en un asunto de suerte en el mejor de los casos y de desastre en otros. Se advierte al estudiante que la

estadstica es slo una de muchas herramientas para resolver problemas de calidad. CONCEPTO DE VARIACIN El concepto de variacin establece que no existen dos artculos que sean perfectamente idnticos. variacin es un fenmeno de la naturaleza y un hecho en el entorno industrial. "idnticos" tienen pequeas diferencias en altura y peso al nacer. Las dimensiones de la ventana de contacto de un chip integrado producido en gran escala varan de un chip a otro; el contenido de las latas de sopa de tomate vara ligeramente de una lata a otra; el tiempo requerido para asignar un asiento en el mostrador de registro de una lnea area vara de un pasajero a otro. Si se ignora la existencia de la variacin (o se racionaliza en forma falsa que es pequea) se La estadstica ayuda a La

Aun los gemelos

puede llegar a tomar decisiones incorrectas sobre problemas importantes.

analizar los datos en forma adecuada y a obtener conclusiones tomando en cuenta la existencia de la variacin. ALCANCE DEL ANLISIS DE DATOS Se presentan algunos tipos de problemas que pueden beneficiarse con el anlisis estadstico: 1. Determinacin de la utilidad de los resultados de un nmero limitado de pruebas en la estimacin del valor verdadero de una caracterstica de un producto. 2. Determinacin del nmero de pruebas que se requieren para proporcionar datos adecuados para la evaluacin. 3. Comparacin de datos de pruebas entre dos diseos alternativos, o comparacin de datos de pruebas de un diseo con los valores de las especificaciones.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

4.

Planeacin de experimentos para determinar si la variable significativa influye a una caracterstica de desempeo.

5.

Determinacin de la relacin cuantitativa entre dos o ms variables.

Este captulo presenta los mtodos estadsticos para manejar estos problemas. INFERENCIA ESTADSTICA Es muy poco confiable obtener conclusiones a partir de un nmero pequeo de datos. "murmuracin" de un tamao de muestra pequeo puede ser muy peligrosa. siguientes problemas concernientes a la evaluacin de datos de prueba. La

Se examinarn los

Para cada uno d una

respuesta de s o no con base en su anlisis intuitivo del problema. (Escriba si respuestas en una hoja de papel ahora y despus verifique las respuestas correctas al fin de este captulo.) Algunos de los problemas estn resueltos dentro del captulo. Ejemplos de problemas de ingeniera que se pueden resolver usando los conceptos de inferencia estadstica 1. Un proceso de moldeado de una sola cavidad produce aisladores con una fuerza impacto promedio de 5.15 pies-lb [6.9834 Newton-metro (N-m)]. Un grupo de aisladores de un nuevo

lote indican un promedio de 4.952 pies-lb (6.7149 N-m) Existe suficiente evidencia para concluir que el nuevo lote tiene una fuerza de impacto promedio menor? 2. Los datos histricos indican una dureza promedio de partes de bronce de 49.95. Se presenta un nuevo diseo y se asegura que tiene mayor dureza. Una muestra de 61 partes del nuevo

diseo muestra un promedio de 54.62. Tiene, de hecho, una dureza diferente el nuevo diseo? 3. Se prob el desgaste de dos tipos de bujas. Una muestra de 10 unidades del diseo 1 indic

un desgaste promedio de 0.0049 in (0.0124 cm). Una muestra de 8 del diseo 2 indic un desgaste promedio de 0.0064 in (0.0163 cm). Son estos datos suficientes para concluir que el diseo 1 es mejor que el diseo 2?

M. en C. Jos Fidencio Domingo Gonzlez Ziga

4.

Slo 11.7% de las 60 paletas de nueva aleacin en un rotor de turbina fallaron al probarlas en una turbina de gas donde se han encontrado fallas del 20% en una serie de pruebas similares en el pasado. Son mejores estas nuevas paletas?

5.

1050 resistores entregados por un fabricante tenan 3.71% de unidades defectuosas. 1690 resistores similares de otro fabricante tenan 1.95% de unidades defectuosas. Es razonable afirmar que el producto de una planta es inferior al de la otra?

Quiz dio usted algunas respuestas incorrectas.

Los mtodos estadsticos que se usan para analizar Para entenderla debe

correctamente estos problemas se conocen como inferencia estadstica. introducirse el concepto de variacin muestral y distribuciones muestrales. VARIACIN MUESTRAL Y DISTRIBUCIONES MUESTRALES

Suponga que debe evaluarse una batera para asegurar que los requerimientos de vida til se cumplen. Se desea una vida media de 30 horas. Los datos preliminares indican que la vida sigue una distribucin

normal y que la desviacin estndar es igual a 10 horas. selecciona al azar una muestra de 4 bateras del proceso y se prueban. Si la media de cuatro bateras es cercana a 30 horas, se concluye que las La figura 10.1 contiene una grfica de la distribucin de las

bateras cumplen con especificaciones.

bateras individuales de la poblacin suponiendo que la media verdadera de la poblacin es exactamente 30 horas. Si se prueba la vida de una muestra de 4, pueden resultar los siguientes tiempos: 34, 28, 38 y 24, lo que da una media de 31.0. Sin embargo, sta es una muestra aleatoria seleccionada entre muchas bateras hechas por el mismo proceso. Suponga que se toma otra muestra de 4. Es probable que la segunda

muestra sea diferente de la primera. Quiz los resultados seran 40, 32,18 y 29, con una media de 29.8. Si el proceso de dibujar muchas muestras (con cuatro unidades cada una) se repitiera una y otra vez, se obtendran resultados diferentes en la mayora de las muestras. muestras se obtuvieron del mismo proceso. variacin muestral. Regresando al problema de evaluar la batera, se tiene un dilema. En la evaluacin real, slo se puede Pero el experimento de obtener Esto es significativo porque todas las

Este evento de diferentes resultados ilustra el concepto de

obtener una muestra de cuatro (por limitaciones de tiempo y costo).

muchas muestras indica que stas varan. La pregunta es: qu tan confiable es la muestra de cuatro

M. en C. Jos Fidencio Domingo Gonzlez Ziga

que ser la base de la decisin? La decisin final puede estar influida por la suerte sobre la muestra que se eligi. El punto importante es que la existencia de las medias de la variacin muestral significa que no se puede confiar en que una sola muestra lleve siempre a una decisin adecuada. El enfoque

estadstico analiza los resultados de la muestra, tomando en cuenta la posible variacin muestral que pueda ocurrir. Se han desarrollado frmulas que definen la cantidad esperada de variacin muestral.

Si sta se conoce, se puede llegar a una decisin vlida basada en la evaluacin de un conjunto de datos de una muestra.

Entonces, el problema es definir cmo varan las medias mustrales.

Si se continuara con el muestreo

y se calculara la media para cada muestra de cuatro unidades, estas medias se podran resumir en un histograma. La figura 10.1 presenta la curva de probabilidad que resulta, sobrepuesta a la curva de la poblacin. La curva angosta representa la distribucin de la vida til para las medias mustrales (donde La

cada promedio incluye cuatro bateras individuales). Esto se llama distribucin muestral de medias.

curva para las medias es ms angosta que la curva de las medidas individuales porque al calcular las medias, se compensan los valores extremos. Se han estudiado las propiedades matemticas de la

curva para los promedios y se ha desarrollado la siguiente relacin:

M. en C. Jos Fidencio Domingo Gonzlez Ziga

La relacin es significativa porque si se puede obtener una estimacin de la desviacin estndar de las unidades individuales, entonces la desviacin estndar de las medias mustrales se puede calcular mediante esta relacin en lugar de realizar un experimento para generar los promedios de las muestras. Ahora se puede ver una grfica del problema de evaluar bateras (figura 10.2).

Este concepto de distribucin muestras es bsico para las reas ms importantes de inferencia estadstica, a saber, la estimacin y las pruebas de hiptesis, que se estudiar continuacin. ESTIMACIN ESTADSTICA: LMITES DE CONFIANZA La estimacin es el proceso de analizar el resultado de una muestra con el fin de predecir el valor correspondiente del parmetro poblacional. Por ejemplo, se mencion antes que la muestra de cuatro bateras tena una vida media de 31.0 horas. Si sta es una muestra representativa del proceso, qu

estimacin se puede hacer de la vida verdadera para toda la poblacin de bateras?

M. en C. Jos Fidencio Domingo Gonzlez Ziga

El establecimiento de la estimacin consta de dos partes: 1. La estimacin puntual es un solo valor que se usa para estimar el parmetro poblacional. Por

ejemplo, 31.0 horas es la estimacin puntual de la vida promedio de la poblacin. 2. El intervalo de confianza es un rango de valores que incluye (con una probabilidad Los lmites

preestablecida llamada nivel de confianza) el valor verdadero de un parmetro poblacional. de confianza son las fronteras inferior y superior del intervalo de confianza.

Un intervalo de confianza
1

es la probabilidad de que una afirmacin sobre el valor de un parmetro poblacional sea correcta.

Los lmites de confianza no deben confundirse con otros lmites, por ejemplo, lmites de control, lmites de tolerancia estadsticos. La tabla 10.1 resume las frmulas de los lmites de confianza para los parmetros comunes. ejemplos que siguen ilustran algunas de estas frmulas. Ejemplo 10.1. Media de una poblacin normal. Veinticinco tipos de latn tienen una dureza media de Los

54.62 y una desviacin estndar estimada de 5.34. Determine los lmites de confianza del 95% para la media. Solucin. Observe que cuando no se conoce la desviacin estndar y se estima a partir de una muestra, debe usarse la distribucin 1 (tabla D en el apndice). El valor t para 97.5% de confianza se encuentra buscando 0.975 y 25 - 1 = 24 grados de libertad
2

y se lee un valor t de 2.064.

Hay un 95% de confianza de que la dureza media verdadera del latn est entre 52.42 y 56.82.

Por lo general, en la prctica se suponen niveles de confianza de 90, 95 o 99% Una derivacin matemtica de los grados de libertad se encuentra ms all del alcance de este libro, pero se puede establecer el concepto fundamental. Grados de libertad (GL) es el parmetro que se calcula cuando, por ejemplo, se usa una desviacin estndar muestral para estimar la desviacin estndar verdadera de un universo. GL es igual al nmero de medidas en la muestra menos algn nmero de restricciones estimadas a partir de los datos con el fin de calcular la desviacin estndar. En este ejemplo, fue necesario estimar slo una constante (la media poblacional) para calcular la desviacin estndar. Por lo tanto, GL = 25 - 1 = 24.
2

M. en C. Jos Fidencio Domingo Gonzlez Ziga

Ejemplo 10.2. Media de una poblacin exponencial.

Un sistema de radar reparable ha estado

operando durante 1200 horas, tiempo durante el cual ocurrieron ocho fallas. Cules son los lmites con un 90% de confianza sobre el tiempo entre fallas para el sistema?

M. en C. Jos Fidencio Domingo Gonzlez Ziga

Solucin

1200

m estimada = 1200/8 = 150 h entre fallas Lmite superior de confianza Lmite inferior de confianza = 2(1200)/7.96 = 301.5 = 2(1200)/26.30 = 91.25

Los valores 7.96 y 26.30, se obtienen en la tabla ji cuadrada (tabla E en el apndice). Existe un 90% de confianza de que la media verdadera del tiempo entre fallas est entre 91.25 y 301.5 h. Ha surgido confusin sobre las aplicaciones del trmino "nivel de confianza" a un ndice de contabilidad como el tiempo medio entre fallas. Para usar un ejemplo diferente suponga que la parte numrica de un

requerimiento de confiabilidad se lee como sigue: "El tiempo medio entre fallas (TMEF) debe ser por lo menos 100 con un nivel de confianza del 90%". Esto significa que: 1. 2. El mnimo TMEF debe ser 100 horas. La pruebas reales deben llevarse a cabo sobre el producto para demostrar con 90% de confianza que el TMEF de 1 00 horas se cumple. 3. Los datos sobre las pruebas deben analizarse calculando el TMEF y el lmite inferior del intervalo de una cola de 90% de confianza. El TMEF verdadero se encuentra arriba de este lmite con 90% de confianza. 4. El lmite de confianza de una cola debe ser > 100 horas.

El trmino "nivel de confianza" desde el punto de vista estadstico tiene grandes implicaciones sobre un programa de pruebas. 100. El TMEF debe ser mayor que 100 si el lmite de confianza inferior ha de ser >

Nivel de confianza significa que deben realizarse suficientes pruebas para demostrar, con validez

M. en C. Jos Fidencio Domingo Gonzlez Ziga

estadstica, que se cumple un requerimiento. Nivel de confianza no se refiere a la opinin cualitativa sobre el cumplimiento de un requerimiento. Adems, el nivel de confianza no disminuye un

requerimiento, es decir, un TMEF de 100 horas a un nivel de confianza del 90% no quiere decir que 0.90 x 1 00 = 90 horas sea aceptable. Han ocurrido estos malentendidos. Cuando se usa el trmino "nivel

de confianza", debe verificarse, no suponerse, la comprensin clara del mismo. IMPORTANCIA DE LOS LMITES DE CONFIANZA AL PLANEAR LOS PROGRAMAS DE PRUEBAS Las pruebas adicionales aumentan la exactitud de las estimaciones. Exactitud, en este caso, se refiere a la concordancia entre una estimacin y el valor verdadero del parmetro de la poblacin. El incremento en exactitud no vara linealmente con el nmero de pruebas, si se duplica el nmero de pruebas por lo general no se duplica la precisin. Examine la grfica (figura 10.3) del intervalo de confianza para la media contra el tamao de la muestra (se supuso una desviacin estndar de 50.0): cuando el tamao de la muestra es pequeo, un incremento tiene un gran efecto en la amplitud del intervalo de confianza; despus de 30 unidades, el efecto de los incrementos es mucho menor. La inclusin del parmetro de costos es vital en este caso. Debe evaluarse el costo de las pruebas adicionales contra el valor de la exactitud adicional. Ms an, si la muestra se selecciona al azar y si el tamao de la muestra es menor que el 10% del tamao de la poblacin, la exactitud depende principalmente del tamao absoluto de la muestra y no del tamao de la muestra expresado como porcentaje de la poblacin. As, un tamao de muestra del 1 % de una poblacin de 100,000 unidades puede ser mejor que una muestra del 10% de una poblacin de 1,000 unidades.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

DETERMINACIN DEL TAMAO DE MUESTRA REQUERIDO PARA LOGRAR UNA EXACTITUD ESPECFICA EN UNA ESTIMACIN Los lmites de confianza pueden ayudara determinar el tamao de los programas de pruebas que se requieren para estimar una caracterstica de un producto dentro de una exactitud especfica. Se desea estimar la media verdadera de la batera antes citada, donde = 10. La estimacin debe estar a menos de 2.0 horas de la media verdadera si ha de ser de alguna utilidad. de 95% sobre la afirmacin de confianza. Se desea un intervalo de confianza

El intervalo de confianza deseado es 2.0 horas, o sea,

2.0 =

(1.96)(10) , n =96
n

Una muestra de 96 bateras proporcionar un promedio que se encuentra a menos de 2.0 horas de la media (con 95% de confianza). Observe el tipo de informacin requerida para estimar la media de una poblacin normal: 1) la amplitud deseada del intervalo de confianza (la exactitud deseada en la estimacin), 2) el nivel de confianza que se quiere y 3) la variabilidad de la caracterstica que se investiga. El nmero de pruebas requerido no se puede Los datos histricos

determinar hasta que el ingeniero proporcione estos elementos de informacin. pueden tambin jugar un papel importante al disear un programa de pruebas. PRUEBAS DE HIPTESIS Conceptos bsicos

Una hiptesis, como se usa en este contexto, es una aseveracin hecha sobre una poblacin. En general, la aseveracin se refiere al valor numrico de algn parmetro de la poblacin. Por ejemplo, una hiptesis puede establecer que la vida media de una poblacin de bateras es igual a 30.0 horas, escrito como H 0 = 30.0. Esta aseveracin puede ser correcta o falsa. Una prueba de hiptesis es una

prueba de la validez de la aseveracin, y se lleva a cabo mediante un anlisis de los datos de la muestra. Existen dos razones por las cuales los resultados de la muestra se deben evaluar con cuidado. Primero, hay muchas otras muestras que, debido al azar, se pueden obtener de la poblacin. Segundo, es fcil

M. en C. Jos Fidencio Domingo Gonzlez Ziga

10

que los resultados numricos de la muestra, que de hecho se seleccion, sean compatibles con varias hiptesis diferentes. Estos aspectos se manejan reconociendo dos tipos de error de muestreo. Al evaluar una hiptesis se pueden cometer dos tipos

LOS DOS TIPOS DE ERROR DE MUESTREO. de errores: 1.

Rechazar la hiptesis cuando es cierta. Esto se llama error tipo l o nivel de significancia. probabilidad de un error tipo I se denota por .

La

2.

Aceptar la hiptesis cuando es falsa. Esto se llama error tipo II y la probabilidad se denota por .

Estos errores se definen en trminos de nmeros probabilsticos y se pueden controlar para que adquieran valores deseados. 10.2. Estos resultados posibles al probar una hiptesis se resumen en la tabla

El error tipo I se presenta en la grfica de la figura 10.4 para la hiptesis H0: 0 = 30.0. El intervalo sobre el eje horizontal entre las lneas verticales representa la regin de aceptacin para la prueba de hiptesis. Si los resultados de la muestra (por ejemplo, la media) caen dentro de esta regin de aceptacin, la hiptesis se acepta. De otra manera, se rechaza. Los trminos "se acepta" y "se rechaza" requieren

una interpretacin cuidadosa. Los significados se explican ms adelante en este captulo. Observe que existe una pequea porcin

de la curva que cae fuera de la regin de aceptacin. Esta rea () representa la mxima probabilidad de obtener un resultado de la muestra fuera de la regin de aceptacin, aun cuando la hiptesis sea correcta.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

11

Suponga que se ha decidido que un error tipo I no debe exceder el 5%. sta es la probabilidad de rechazar una hiptesis cuando en realidad la media verdadera de la vida es 30.0. La regin de aceptacin se puede obtener localizando los valores de la vida media que tienen slo una oportunidad del 5% de ser excedidos cuando la vida media verdadera es 30.0. Ms an, suponga que se toma una muestra n de cuatro medidas y = 10.0. Recuerde que la curva representa una poblacin de medias mustrales porque la decisin se har con base en una media muestral. la relacin x = Las medias mustrales varan menos que las medidas individuales segn

(vea la seccin: "variacin muestral y distribuciones mustrales").

Todava ms, la distribucin de las medias mustrales es aproximadamente normal aunque la distribucin de las medidas individuales (que se usan para las medias) no lo sea. La aproximacin se

cumple mejor para valores grandes de n pero es adecuada para n tan pequea como 4. La tabla A en el apndice muestra que un rea de 2.5% en cada cola se encuentra en un lmite que corresponde a 1.96 desviaciones estndar de 30.0. Entonces, bajo la hiptesis de que 0 = 30.0, 95% de las medias mustrales caern a menos de 1.96x de 30.0, o sea

Lmite superior = 30.0 + 1.96

10 = 39.8 4

M. en C. Jos Fidencio Domingo Gonzlez Ziga

12

Lmite inferior = 30.0 - 1.96

10 = 20.2 4

Por lo tanto, la regin de aceptacin se define como de 20.2 a 39.8. Si la media de una muestra aleatoria de cuatro bateras est dentro de la regin de aceptacin, la hiptesis se acepta. encuentra fuera de esta regin, la hiptesis se rechaza. error I de 0.05. El error tipo II, o , la probabilidad de aceptar una hiptesis cuando es falsa, se presenta en la figura 10.5 como el rea sombreada. Observe que es posible obtener un resultado muestral dentro de la regin de Si la media se

Esta regla de decisin proporciona un tipo de

aceptacin, aun cuando la poblacin tenga una media que no sea igual a la media establecida en la hiptesis. El valor numrico de depende del valor verdadero de la media poblacional (y tambin de n, y ).

DETERMINACION DEL TAMANO DE LA MUESTRA REQUERIDO PARA UNA PRUEBA DE HIPOTESIS En las secciones anteriores se supuso que el tamao de la muestra estaba fijo por razones no estadsticas y que slo el error tipo I estaba definido para la prueba. El procedimiento ideal es definir de

antemano el nivel deseado de los errores tipo I y tipo II y calcular el tamao de la muestra requerido para cubrir ambos tipos de errores.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

13

El tamao de la muestra requerido depender de: 1) el riesgo muestral deseado ( y ) 2) el tamao de la menor diferencia verdadera que debe detectarse y 3) la variacin en la caracterstica que se mide. El tamao de la muestra se puede determinar usando la curva caracterstica de operacin para la prueba (vea QCH4, pgina 23.78).

M. en C. Jos Fidencio Domingo Gonzlez Ziga

14

DISEO DE EXPERIMENTOS Los experimentos pueden tener una amplia variedad de objetivos, y la mejor estrategia depende de esos objetivos. En algunos experimentos, el objetivo es encontrar las variables ms importantes que afectan una caracterstica de calidad. experimentos. El plan para llevar a cabo tales experimentos se llama diseo de

Primero se estudiar un ejemplo que presenta varios diseos posibles y define la

terminologa bsica y los conceptos. Suponga que deben compararse la habilidad de limpieza de ropa de tres detergentes para lavadoras automticas. Las lecturas de "blancura" obtenidas con un procedimiento especial de medicin reciben

el nombre de variable dependiente o de respuesta. La variable bajo investigacin (detergente) es un factor y cada variacin del factor se llama nivel; esto es, existen tres niveles. cualitativo (detergentes diferentes) o cuantitativo (temperatura del agua). Un factor puede ser Por ltimo, algunos

experimentos tienen un modelo de efectos fijos, es decir, los niveles investigados representan todos los niveles relevantes para el investigador (por ejemplo, tres marcas de lavadoras). Otros experimentos

tiene un modelo de efecto aleatorio, es decir, los niveles elegidos son slo una muestra de una poblacin ms grande (por ejemplo, tres operadores de lavadoras). tipos de factores, fijos y aleatorios. La figura 10.11 describe los seis diseos de experimentos comenzando con el diseo clsico en la figura 10.11 a. En ste, todos los factores se mantienen constantes excepto el detergente. Entonces se Un modelo de efectos mezclados tiene ambos

corren nueve pruebas, tres con cada detergente con el tiempo de lavado, marca de lavadora, temperatura del agua y todos los dems factores constantes. Un inconveniente de este diseo es que

las conclusiones sobre las marcas de detergente se aplicaran slo a las condiciones especficas del experimento. La figura 10.11 b reconoce un segundo factor a los tres niveles, las marcas de lavadoras I, II y III. Sin embargo, en este diseo no se sabra si una diferencia observada se debe a los detergentes o a los tiempos de lavado. En la figura 10.11 c, las nueve pruebas se asignan completamente al azar; de ah el nombre de diseo totalmente aleatorio. Pero el detergente A no se usa en la lavadora marca III y el detergente B no se

usa en la lavadora marca I, y esto complica las conclusiones.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

15

La figura 1 0. 11 d presenta un diseo de bloques aleatorio.

En este caso, cada bloque es una marca

de lavadora y los detergentes se usan en orden aleatorio dentro de cada bloque. Esto evita cualquier sesgo posible debido al orden en el que se usan los detergentes. anlisis subsecuente de datos y para las conclusiones. Este diseo tiene ventajas para el

Primero, se puede realizar una prueba de

hiptesis para comparar los detergentes y realizar una prueba separada para comparar las lavadoras y las nueve observaciones se pueden usar en las dos pruebas de hiptesis. Segundo, las conclusiones

respecto a los detergentes se aplican a las tres mquinas y viceversa, lo que proporciona conclusiones dentro de un rango ms amplio de condiciones. Ahora, suponga que tambin se quiere estudiar otro factor como la temperatura del agua. Esto se puede hacer con el diseo del cuadro latino que se ve en la figura 1 0. 11e. Observe que este diseo requiere que se use cada detergente slo una vez en cada mquina y slo una vez con cada temperatura. Entonces, se pueden evaluar los tres factores (con tres pruebas de hiptesis separadas) No obstante, existe un peligro. Este diseo supone que no existe Que no haya interaccin entre mquina y detergente significa que el

con slo nueve observaciones. "interaccin" entre los factores.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

16

efecto de cambiar el detergente A al B o al C no depende de la lavadora que se usa, y lo mismo pasa con otras combinaciones de factores. El concepto de interaccin se ilustra en la figura 10.12.

Para terminar, se pueden investigar los factores principales y las interacciones posibles mediante el diseo factorial de la figura 10.11f. "Factorial" significa que se realiza al menos una prueba para cada Se pueden hacer

combinacin de los factores principales, en este caso 3 x 3 x 3 = 27 combinaciones.

pruebas de hiptesis separadas para evaluar los factores principales adems de las interacciones posibles. De nuevo, todas las observaciones contribuyen a cada comparacin.

Se explicarn ahora varias herramientas usadas en este ejemplo.

Al disear el experimento, surgen algunas preguntas importantes: 1. Qu tan grande debe ser la diferencia en las condiciones que se comparan, para que se considere significativa desde el punto de vista de ingeniera? (Qu tamao de diferencia se quiere que detecte el experimento?) 2. Cunta variacin se ha venido experimentando en las caractersticas de calidad bajo investigacin? 3. Qu riesgo se quiere correr en cuanto a que el experimento llegue a la conclusin incorrecta de que existe una diferencia significativa cuando la conclusin correcta es que no existe una diferencia significativa? (ste es el error tipo l.)

M. en C. Jos Fidencio Domingo Gonzlez Ziga

17

4. Qu riesgo se quiere correr en cuanto a que el experimento no detecte una diferencia que de hecho exista? (ste es el error tipo ll.) 5. Se tiene conocimiento sobre las posibles interacciones de los factores? Se quiere hacer una prueba sobre estas interacciones? Muchos problemas experimentales se pueden manejar con uno de los diseos de experimentos estndar (vea QCH4, tabla 26.3). CONTRASTE ENTRE LOS MTODOS EXPERIMENTACIN CLSICOS MODERNOS El contraste entre los mtodos de experimentacin clsicos (que varan un factor a la vez, y mantienen todo lo dems constante) y el enfoque moderno es asombroso. La tabla 10.5 compara estos dos

enfoques para un experimento en el que se tienen dos factores (o variables) cuyos efectos sobre la caracterstica se investigan. (Las mismas conclusiones se cumplen para un experimento con ms de dos factores.) Este anlisis se ha restringido al diseo o planeacin del experimento. comienza la fase de anlisis. Despus de recolectar los datos,

Para experimentos sencillos, algunas pruebas de hiptesis bsicas y los Cuando se trata de

lmites de confianza (estudiados antes) constituyen las herramientas de anlisis.

experimentos ms complejos, se usan herramientas adicionales como el anlisis de la varianza (vea QCH4, seccin 26) y el anlisis grfico de las medias (vea Ryan, 1989). ANALISIS DE REGRESION Los problemas de calidad en ocasiones requieren el estudio de una relacin entre dos o ms variables; el cual se denomina anlisis de regresin. El uso del anlisis de regresin incluye un pronstico o

prediccin, la determinacin de las variables importantes que influyen sobre algn resultado y la localizacin de las condiciones de operacin ptimas.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

18

M. en C. Jos Fidencio Domingo Gonzlez Ziga

19

Los pasos en un estudio de regresin son: 1. Definir con claridad los objetivos de estudio. Esto debe incluir una definicin de la variable

dependiente o de respuesta y de las variables independientes que puedan estar relacionadas con la variable dependiente. 2. Recolectar pares de valores de datos. 3. Preparar diagramas de dispersin (grficas de una variable contra otra). 4. Calcular la ecuacin de regresin. 5. Estudiar la ecuacin para ver si se ajusta bien a los datos. 6. Proporcionar medidas sobre la precisin de la ecuacin. Estos pasos se ilustrarn con un ejemplo. Suponga que se piensa que la vida de una herramienta vara con la velocidad de corte y que se desea predecir la vida con base en esta velocidad. Entonces la vida

es la variable dependiente (Y) y la velocidad de corte es la variable independiente (X). Se recolectan los datos para cuatro velocidades diferentes (tabla 10.6). La grfica de los datos se llama diagrama de dispersin (figura 10.13). siempre antes de pasar a cualquier otro anlisis. Esta grfica debe prepararse

La grfica por si sola puede proporcionar suficiente

informacin sobre la relacin entre las variables como para obtener conclusiones sobre el problema inmediato; esta grfica tambin es til para sugerir formas posibles de la ecuacin de estimacin. La

M. en C. Jos Fidencio Domingo Gonzlez Ziga

20

figura 10.13 insina que la vida vara con la velocidad de corte (es decir, que la vida disminuye si se aumenta la velocidad) y que esta variacin es lineal (esto es, los incrementos en velocidad dan como resultado cierta disminucin en la vida que es la misma para todo el rango de los datos). la relacin no es perfecta -los puntos se dispersan con respecto a la recta. Con frecuencia es valioso determinar una ecuacin de regresin. Cuando se tienen relaciones lineales, Observe que

esto se puede hacer de manera aproximada dibujando una lnea recta a ojo y despus estimando en la grfica, Y, la ordenada al origen, y la pendiente. El modelo de regresin lineal es Y = 0 + 1X + c En donde 0 y 1 son la ordenada y la pendiente poblacionales desconocidas y c es el trmino del error aleatorio, que puede deberse a errores de medicin y o a efectos de las otras variables independientes. = b0 + b1X Donde es el valor pronosticado de Y para un valor dado de X, y b0 y b1 son las estimaciones mustrales de o y 1. Estas estimaciones, por lo general, se encuentran con el mtodo de mnimos cuadrados, llamado as porque minimiza la suma de los cuadrados de las desviaciones entre los valores observados y los pronosticados de Y. Las estimaciones de mnimos cuadrados son Este modelo se estima a partir de los datos mustrales mediante la frmula

M. en C. Jos Fidencio Domingo Gonzlez Ziga

21

Las sumatorias van de m = 1 a m = N, donde N es el nmero total de conjuntos de valores de X y Y. Los clculos detallados se manejan con facilidad con un programa de software para regresin. estos datos: b1 =-1191.25/875 = - 1.3614 bo = 23.06 (-1.3614)(101.25) = 160.9018 y entonces la ecuacin de prediccin es = 160.90 - 1.36l4X Despus de estimar los coeficientes de la ecuacin de prediccin, debe graficarse sta sobre los datos para verificar si hay errores grandes de clculo. En trminos generales, la mitad de los datos deben Para

aparecer arriba de la lnea y la mitad abajo. Adems, la ecuacin debe pasar justo a travs de los puntos X y Y. Existen muchos criterios para evaluar qu tan adecuada es la ecuacin de prediccin. Una medida
2 2 comn es R , la proporcin de la variacin explicada por la ecuacin de prediccin. R se llama

coeficiente de determinacin. sta es, la razn de la variacin debida a la regresin, (m-) entre la
2 variacin total, (Ym, - ) . m es el valor de la Y pronosticada por Xm.

La frmula para el clculo es

Entonces, para este ejemplo, la ecuacin de prediccin explica 82.8% de la variacin en la vida de la herramienta. El coeficiente de determinacin y todas las otras medidas de la precisin de una relacin de regresin se deben interpretar con gran cuidado. sta no es un rea para un novato. Esta breve presentacin de la regresin es slo una introduccin a un tema complejo. Otros temas incluyen intervalos de confianza y otras medidas de precisin, regresin mltiple y regresin no lineal. La literatura proporciona ms informacin (vea QCH4, pginas 23.96-23.116).

M. en C. Jos Fidencio Domingo Gonzlez Ziga

22

ESTUDIOS ENUMERATIVO Y ANALTICO Deming (1982) proporciona una importante distincin entre dos tipos de estudios estadsticos: enumerativo y analtico. En un estudio enumerativo, se mide una muestra y despus se estiman las caractersticas de la poblacin. de un lote de 100 unidades. poblacin de 100. Por ejemplo, se obtiene una muestra aleatoria de 20 unidades a partir Se miden las 20 unidades y despus se hace una prediccin sobre la

Todo esto implica una poblacin definida y existente. Es comn que en un estudio

enumerativo, no se documente la informacin sobre el orden de produccin, esto es una lstima. En un estudio analtico, se miden muestras peridicas de un proceso continuo de fabricacin de un producto, esto es, se tiene una poblacin cambiante. Suponga que se quieren predecir los resultados para el siguiente lote de productos de ese proceso. La prediccin requerir dos suposiciones: 1) el proceso se ha estabilizado en un conjunto de condiciones que se repetirn en el futuro y 2) cualquier otro proceso anidado en l cambia con el tiempo, como se sabe que lo hacen las tendencias y los efectos cclicos. Para predecir los resultados futuros del proceso es esencial que se documenten los datos

sobre el orden de produccin y se usen para analizar la estabilidad del proceso y los efectos del tiempo anidados. En este tipo de anlisis son tiles las tcnicas tales como las grficas o cartas control En la prctica predomina la prediccin de los

estadstico (vea: "control estadstico del proceso").

resultados futuros de un proceso y, por lo tanto, los estudios de tipo analtico son de gran importancia. PAQUETES DE COMPUTADORA PARA EL ANLISIS ESTADSTICO Con el advenimiento de los paquetes de computacin, el que las pone en prctica puede usar ahora muchas tcnicas estadsticas que antes no se empleaban por la dificultad para entenderlas o por la complejidad de los clculos. se presenta el resultado final. Ahora los procedimientos definen la entrada a una computadora y despus Con esta forma tan accesible se corre peligro. Quien est usando estas

tcnicas debe entender las suposiciones en las que se fundamentan los mtodos, y lo que significan y lo que no, los resultado finales de hacer una aplicacin equivocada. En el afn de obtener una respuesta rpida y evitar los detalles tediosos, existe el peligro de hacer una aplicacin equivocada de una tcnica o de entender mal un resultado. Las serias consecuencias imponen la necesidad de entender. QCH4, ASQC publica cada ao en la revista Quality

seccin 27, presenta una lista de paquetes estadsticos.

Progress un "directorio de software para el aseguramiento de la calidad y el control de calidad".

M. en C. Jos Fidencio Domingo Gonzlez Ziga

23

The Journal of Quality Technology publica normalmente programas para computadora para mtodos estadsticos especficos. Respuestas a las preguntas al principio del captulo: 1. S 2. S 3. S 4. No 5. S RESUMEN

Estimacin es el proceso de analizar el resultado de una muestra con el fin de predecir el valor correspondiente del parmetro poblacional. La estimacin puntual es un valor que se usa para estimar el parmetro poblacional. El intervalo de confianza es un rango de valores que incluye (con una probabilidad preasignada llamada nivel de confianza) el valor verdadero de un parmetro poblacional. Una hiptesis es una aseveracin sobre una poblacin. Una prueba de hiptesis es una prueba de la

validez de la aseveracin y se lleva a cabo mediante el anlisis de los datos de una muestra. Al evaluar una hiptesis, se pueden cometer dos tipos de errores: error tipo I, rechazar la hiptesis cuando es cierta, y error tipo II, aceptar una hiptesis cuando es falsa. El diseo estadstico de experimentos proporciona planes para llevar a cabo experimentos con los que se puedan realizar anlisis estadsticos vlidos. La aleatorizacin es la asignacin de especmenes a tratatnientos, en forma totalmente al azar. La rplica es la repeticin de una observacin o medida. El anlisis de regresin es el estudio de las relaciones entre dos o ms variables. PROBLEMAS Nota.- Las preguntas especficas se han establecido, a propsito, en un lenguaje no estadstico para proporcionar al estudiante algo de prctica al elegir las tcnicas y hacer las suposiciones. Cuando se requiera, utilice un error tipo 1 de 0.05 y un nivel de confianza de 95%. Establezca cualquier otra suposicin que sea necesaria.

1.

En la industria de los moldes, la temperatura de vaciado del metal es importante.

Para una

aleacin de aluminio, la experiencia indica una desviacin estndar de 15. se hicieron cinco pruebas de temperatura en el momento del vaciado.

Durante un da en particular,

M. en C. Jos Fidencio Domingo Gonzlez Ziga

24

a)

Si el promedio de estas medidas fue 1650, haga una declaracin sobre la temperatura promedio

de vaciado. b) Si hubiera hecho 25 mediciones y obtenido los mismos resultados, qu efecto tendra esto en

su afirmacin? Revise su declaracin. 2. En la empresa de moldes mencionada en el problema 1, se est vaciando una nueva aleacin de Durante el primer da se hicieron cinco pruebas de la temperatura de vaciado con los

aluminio.

siguientes resultados:

1705

1725

1685

1690

1715

Haga una declaracin sobre la temperatura promedio de vaciado de este metal. 3. Un fabricante realiza pruebas de presin sobre empaques para ver si hay fugas. La presin a la

que este empaque fug en nueve pruebas fue (en psi):

4000 4200 4800

3900 4400 4800

4500 4300 4300

Haga una declaracin sobre la presin de "fuga" promedio para este empaque. 4. En una prueba de 500 conductores electrnicos, 427 fueron aceptables. Haga una declaracin

respecto a la proporcin verdadera de lo que sera aceptable. 5. En una empacadora de carnes, de 600 piezas de res, se encontr que 420 eran de primera.

Haga una declaracin sobre la proporcin verdadera de carne de primera. 6. Una especificacin requiere que la fuerza promedio antes del rompimiento de cierto material sea Los datos histricos indican que la desviacin estndar de las medidas individuales

al menos 180 psi.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

25

es 5 psi. Cuntas pruebas son necesarias para tener una seguridad del 99% de detectar un lote que tiene una fuerza promedio de 170 psi? 7. Deben realizarse pruebas para estimar la vida promedio de un producto. Segn datos

anteriores de productos similares, se supone que la desviacin estndar de las unidades individuales es de alrededor del 20% de la vida promedio. a) Cuntas unidades se deben probar para tener una seguridad del 90% de que la estimacin

muestral estar a menos del 5% del promedio verdadero? b) Suponga que se dispone de fondos para correr slo 25 pruebas.Qu an eguro se puede estar

de obtener una estimacin a menos del 5%? Respuesta: 8. a) 44. b) 78.8%.

Un fabricante de agujas tiene un nuevo mtodo para controlar la dimensin del dimetro. A

partir de muchas mediciones del mtodo actual se sabe que el dimetro promedio es 0.076 cm con una desviacin estndar de 0.0 1 0 cm. Una muestra de 25 agujas del nuevo proceso indica que el

promedio es 0.071. Si se desea un dimetro menor, debe adaptarse el nuevo mtodo? (Suponga que la desviacin estndar del nuevo mtodo es la misma que para el mtodo actual). 9. En la industria del vestido, la fuerza antes del rompimiento de la tela es importante. Una tela de

algodn gruesa debe tener, por lo menos, una fuerza antes del rompimiento de 200 psi. Se obtuvieron cinco medidas de la fuerza de rompimiento (en psi) a partir de un lote especfico de esta tela:

206 194 203 196 192

M. en C. Jos Fidencio Domingo Gonzlez Ziga

26

Cumple este lote de tela con el requerimiento de una fuerza antes del rompimiento de 200 psi? Respuesta: 1 = - 0.67. 10. En un laboratorio de medicamentos es importante la variacin en el peso de un antibitico de un lote a otro. Con el proceso actual, la desviacin estndar es 0.11 g. El departamento de investigacin ha desarrollado un nuevo proceso que se piensa producir menos variacin. Se obtuvieron las siguientes medidas de peso (en gramos) con el nuevo proceso:

7.47 7.49 7.64 7.59 7.55

Tiene menor variacin este nuevo proceso?

11.Un fabricante de papel tiene un nuevo mtodo para recubrir.

Si logra menor variacin en el peso del

recubrimiento, el producto ser ms uniforme y de mejor calidad. Obtuvo la siguiente muestra de 10 recubrimientos con el nuevo mtodo:

Pesos de] recubrimiento (peso/unidad de rea x 100) 223 215 234 229

M. en C. Jos Fidencio Domingo Gonzlez Ziga

27

220 238 230

223 235 227

Si en el pasado la desviacin estndar era 9.3, es mejor este mtodo propuesto? Debe el fabricante implantarlo? Respuesta: X' = 5.43.

12. Un fabricante de productos de hule quiere decidir qu "receta" usar para un compuesto de hule en particular. Es deseable una fuerza de tensin grande. La mezcla de la receta 1 es ms barata, pero

no est seguro de que su fuerza sea ms o menos igual que la de la receta 2. Se hacen 5 lotes del compuesto con cada receta y se prueba la fuerza de tensin. psi): Se recolectaron los siguientes datos (en

Receta 1 3067 3200 2730 2840 2913 2789 2777 2623 2044 2834

Receta 2

Qu receta recomendara que usara?

M. en C. Jos Fidencio Domingo Gonzlez Ziga

28

13. Se realizan pruebas con cinco modelos de un motor experimental y se obtiene que, con 1 galn de cierto tipo de combustible, operan durante 20, 18, 22, 17 y 18 min, respectivamente. Una especificacin

propuesta establece que el motor debe operar, en promedio, durante 22 min por lo menos. a) Qu se puede concluir sobre la capacidad de la mquina para cumplir con la especificacin? b) Cul es la probabilidad de que la media muestra se haya obtenido a partir de un proceso cuya media verdadera es igual a la media especificada? c) Qu tan pequea puede ser la media de operacin en minutos (de la poblacin de motores) con el fin de tener una oportunidad del 50% de concluir que el motor no cumple con la especificacin? Respuesta: a) t = -3.4. b) Alrededor de 0.03. c) 20. l.

14. Un fabricante asegura que la longitud promedio en un lote grande de partes es 2.680 in.

Una gran

cantidad de datos histricos indican que la desviacin estndar de las longitudes individuales es 0.002 in. Una muestra de 25 partes indica un promedio de 2.678 in. El fabricante dice que el resultado es

consistente con su afirmacin porque se tom una muestra pequea. a) b) c) Establezca una hiptesis para evaluar esta aseveracin. Evale la aseveracin mediante el enfoque estndar de pruebas de hiptesis. Evale la aseveracin mediante el enfoque de lmites de confianza.

15. Una ingeniera quiere determinar si el tipo de horno de prueba o la temperatura empleada tienen un efecto significativo en la vida promedio de una componente. experimento: Ella propone el siguiente diseo de

550' 575' 6001

Horno 1 1 o o 1 1 1

Horno 2 1 1 o

Horno 3

Los nmeros que se encuentran en el cuerpo de la tabla representan el nmero de medi que deben hacerse en el experimento. Establezca dos razones por las que la interaccin no puede evaluar de

manera adecuada en este diseo.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

29

16. El departamento de moldeo en una planta de fabricacin de discos ha producido muchosdi defectuosos. Existen muchas opiniones sobre las causas. Una de ellas establece que el tie de moldeo

por disco tiene una relacin causa-efecto con el nmero de unidades defectuo que se producen por cada 1 00 discos. moldeo. Se realizaron varias pruebas con lotes de 1 00 dis( cada prueba con distinto tiempo de

Los resultados fueron:

Tiempo, s

Nmero de unidades defectuosas

16

13

1o

11

13

17

M. en C. Jos Fidencio Domingo Gonzlez Ziga

30

17

20

Grafique los datos y haga una estimacin grfica de la ordenada, Y, y de la pendiente. Respuesta: Las estimaciones de mnimos cuadrados son una ordenada Y = 13.54 y una pendiente de -0.6076.

REFERENCIAS

Deming, W. Edwards, (1982).

Out ofthe Crisis, Massachusetts Institute of 'fechnology, Cambridg@

Massachusetts, p. 132. Duncan, Acheson J. (1 986,). Quality Control and Industrial Stalistics, 5a. ed., Richard D. Ir@vin, Llome.

wood, Illinois.

Ryan, T. P. (1989). Statistical Methodsfor Quality Improvement, John Wiley and Sons, Nueva York.

LECTURAS COMPLEMENTARIAS

Mtodos estadsticos: ASQC folletos "How Te" (serie de 13).

QCH4, secciones 23-26.

M. en C. Jos Fidencio Domingo Gonzlez Ziga

31

Siddhartha, R. Dalal, Edward B. Fowlkes y Bruce Hoadley (1989). "Risk Analysis of the Space Shuttle: Pre-Challenger Prediction of Future", Journal ofthe American StatisticalAssociation, diciembre, pp. 945-957.

Wadsworth, Harrison M., Jr. (1990). McGraw-Hill, Inc., Nueva York.

Handbook of Statistical Methods for Engineers and Scientists,

M. en C. Jos Fidencio Domingo Gonzlez Ziga

32

También podría gustarte