Está en la página 1de 111

MANUAL DE CONTROL ESTADSTICO DE PROCESOS INDICE 1 .- INTRODUCCIN A LA PROBABILIDAD 2 .

- CONCEPTOS ESTADSTICOS FUNDAMENTALES


o o

Poblacin estadstica La Distribucin de Frecuencias

3.- METRICA EN EL ESPACIO ESTADISTICO


o o o o

Medidas de tendencia central Medidas de Dispersin Media y Varianza de una Muestra Muestreo Aleatorio

4.- FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES


o o o o o o o

Generalidades La Distribucin Normal La Distribucin Normal Standard La Distribucin T de Student Distribucin de Promedios Muestrales Distribucin binomial Distribucin de Poisson

5.- TEST DE HIPTESIS


o o

Herramientas para contrastar hiptesis Regin crtica. Tipos de errores .


Contraste de medias. Contraste de diferencia de medias

Comprobacin de la normalidad de una muestra.

6 .- CONTROL DE PROCESO
o o o o o o o

Control de proceso Control Estadstico de Proceso (C.E.P.) Grficos C.E.P. Generalidades Variables y atributos Eficacia estadstica de los grficos de control Subgrupos racionales Ventajas de los grficos de control

7.- GRAFICOS DE CONTROL POR VARIABLES


o o

Introduccin. Grficos de control (


, R)

Grfico basado en estudio inicial Grficos basados en valores standar Grficos de control para valores individuales Grficos de control de media mvil (desgaste de herramientas)

o o o

Recogida de datos e interpretacin Establecimiento de lmites del Proceso Lneas generales para el diseo del grafico ( Interpretacin de los grficos ( Eficacia de los grficos ( , S) , R) , R) , R)

Grficos de control (

Grficos de control de sumas acumuladas (CUSUM) Otros grficos de control


Grfico de control de media mvil Grficos de Control Multidimensional

8.- CAPACIDAD DEL PROCESO


o o

Introduccin Anlisis de la capacidad del proceso

Anlisis de la capacidad del proceso usando histogramas

Anlisis de la capacidad del proceso usando grficos de control

9.- GRAFICOS DE CONTROL POR ATRIBUTOS


o o

Introduccin Grfico p para porcentajes defectuosos


Operativa del grfico de control p Diseo del grfico p

o o o o

Grfico np para unidades defectuosas Grficos C para tamao de muestra constante Anlisis de defectos Grfico U

10.- LINEAS GENERALES PARA IMPLANTAR GRAFICOS DE CONTROL

CAPTULO 1.- INTRODUCCIN A LA PROBABILIDAD Cada vez que realizamos un clculo matemtico para resolver un problema fsico, estamos aplicando un modelo matemtico a un fenmeno de la realidad. Este fenmeno puede ser, por ejemplo, la cada de un objeto desde cierta altura, y en este caso utilizamos un modelo que es la Ley de Gravedad. Qu es un modelo?. Al enfrentar un problema de fsica, qumica, ingeniera, etc., estamos analizando e investigando una parte o aspecto de la realidad material que nos rodea. Para resolver el problema, necesitamos modelar esa realidad, es decir, construir una representacin en la mente de cmo ocurren los hechos, junto con ecuaciones matemticas que permitan calcular los efectos de los mismos. En ningn caso se debe confundir modelo con realidad. Un modelo es slo una representacin de la realidad, utilizado para estudiar y analizar dicha realidad. Hay modelos matemticos que nos permiten obtener un resultado numrico preciso, por ejemplo, que la velocidad de un automvil es de 175,5 Km/Hora. O que la corriente elctrica que circula por un cable es de 5,7 Amperios. Este tipo de modelos matemticos se denominan Determinsticos. Existen tambin fenmenos que necesitan otro tipo de modelos matemticos, denominados no determinsticos, probabilsticos o estocsticos. Por ejemplo, supongamos que se ha previsto la realizacin de unas pruebas balsticas para las que se necesita saber la cantidad de lluvia que va a caer en un prximo periodo de tiempo, antes de decidir la forma de llevar a cabo los ensayos. El Tcnico responsable podr informarse en el servicio meteorolgico en relacin con la presin baromtrica, la temperatura, velocidad del viento y otros datos meteorolgicos, sin embargo, no hay una ecuacin que con todos esos datos le permita calcular de forma precisa los milmetros de lluvia que van a caer durante el periodo de tiempo que le interesa. De la misma forma, ningn operador puede calcular cuanto va a subir la Bolsa, ni siquiera si va a subir o bajar, an cuando tenga a su alcance todas las variables econmicas disponibles.

Este tipo de fenmenos no admiten un modelo determinstico, sino un modelo probabilstico, que como resultado nos dice la probabilidad de que llueva una cierta cantidad, o la probabilidad de que la Bolsa suba un cierto porcentaje. El resultado no es un valor determinado, sino la probabilidad de un valor. Veamos algunos ejemplos de fenmenos para los cuales es apropiado utilizar un modelo probabilstico: Experimento 1: Se lanza un dado y se anota el nmero que aparece en la cara superior. Experimento 2: Se arroja una moneda cuatro veces y se anota la sucesin de caras y cruces obtenidas. Experimento 3: Se fabrican artculos en una lnea de produccin y se cuenta el nmero de artculos defectuosos producidos en 24 horas. En todos estos casos, el resultado del experimento no se puede predecir con absoluta certeza. Hay varios resultados posibles cada vez que se realiza la experiencia. Para cada experimento del tipo que estamos considerando, se define el Espacio Muestral como el conjunto de todos los resultados posibles que pueden producirse al realizar el experimento. Los espacios muestrales respectivos son : S1 = {1,2,3,4,5,6} S2 = {cccc, xccc, cxcc, ccxc, cccx, xxcc, xcxc, xccx, cxcx, ccxx, xxxc, xxcx, cxxx, xcxx, xxxx} S3 = {1,2,3,, N} ; N mximo de artculos producidos en 24 horas. Un Suceso, respecto a un espacio muestral S asociado con determinado experimento, es un subconjunto de resultados del espacio muestral. El conjunto

vaco, el formado por un solo elemento y el formado por todos los elementos del espacio muestral son tambin sucesos. Vemos entonces que, dado un experimento aleatorio cualquiera, hay un espacio muestral asociado cuyos elementos son todos los resultados que se pueden obtener de la experiencia. Un subgrupo o subconjunto de resultados es un suceso. Ahora, cmo podemos saber si la posibilidad de que ocurra un suceso es grande o pequea? Por ejemplo, si arrojamos un dado, cmo podemos calcular la probabilidad de que salga un 2 ?. Para esto necesitamos un nmero asociado con cada suceso, al cual se lo denomina probabilidad del suceso. Entonces, la probabilidad P de un suceso es un nmero entre 0 y 1, que nos dice en que medida es posible que ocurra el suceso. Si la probabilidad es 1 significa que el suceso ocurrir con toda certeza. Si la probabilidad es 0,5 significa que un suceso puede ocurrir o puede no ocurrir con la misma probabilidad. Probabilidad 0 quiere decir que el suceso es imposible que ocurra. Cmo podemos calcular la Probabilidad de un suceso?

La

respuesta

esta

pregunta

no

siempre es sencilla y depende del experimento y de su espacio muestral asociado. Hay casos simples en los que el clculo es relativamente sencillo. En primer trmino, supondremos que se trata de un experimento cuyo espacio muestral es finito y tiene un nmero pequeo de resultados posibles. En segundo trmino, supondremos que todos los resultados que integran el espacio muestral (sucesos elementales) tienen la misma probabilidad de ocurrir. Con estas dos hiptesis, la frmula para calcular la probabilidad es muy sencilla. Supongamos que se trata de un experimento cualquiera cuyo espacio muestral S tiene N elementos (N resultados posibles). Deseamos calcular la probabilidad de un suceso H (Un subconjunto H del espacio muestral S) que 6

tiene m elementos. De acuerdo a lo dicho previamente, el nmero N tiene que ser pequeo y la probabilidad de cada suceso elemental tiene que ser la misma. Entonces la probabilidad P de que ocurra el suceso H es: P = m/N Veamos algunos ejemplos. Supongamos que se arroja un dado sobre una mesa y apostamos a que salga un nmero igual o menor que 4. Sabemos que son igualmente posibles los nmeros: {1, 2, 3, 4, 5 y 6} (Espacio muestral con 6 elementos). Pero los nmeros favorables a nuestra apuesta son: {1, 2, 3 y 4} (Suceso con 4 elementos). Entonces, la probabilidad de que ganemos es P = 4/6 = 0,666 Es decir que tenemos a nuestro favor una probabilidad de 0,666.. (o sea aproximadamente del 67 %). Si apostamos a un slo nmero (sacar un As), la probabilidad de ganar sera P = 1/6 = 0,1666 Repitiendo, la probabilidad es un nmero entre 0 y 1, que nos dice en que medida es posible que ocurra un suceso.

CAPITULO

2.-

CONCEPTOS

ESTADSTICOS

FUNDAMENTALES

Poblacin estadstica. Hasta ahora hemos visto el caso de fenmenos o experimentos cuyo espacio muestral asociado tiene un nmero pequeo de elementos. Ello nos ha servido para introducir la nocin de probabilidad, Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un nmero muy grande de datos o resultados numricos, es decir, espacios muestrales con un nmero infinito o muy grande de elementos. Cuando tenemos un conjunto muy grande de datos numricos para analizar decimos que tenemos un Universo o Poblacin de observaciones. Cada dato numrico es un elemento de la poblacin o universo. Una Muestra es un subconjunto pequeo de observaciones extradas de un universo o poblacin. La Estadstica de trabaja datos y con con

poblaciones

muestras extradas de las mismas. Los conceptos de poblacin y muestra ambiguos prctica. Por ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo mdico en el cual se mide el peso, la altura y se relevan otros datos de todos los habitantes de la ciudad. Alguien podra referirse al universo o poblacin censada teniendo in mente el conjunto de los habitantes de la ciudad. Pero cuando hablamos en trminos estadsticos, nos referimos a poblaciones o universos de datos. Por ejemplo, el conjunto de todas las mediciones de altura (De los habitantes de la ciudad) es un conjunto de datos y por lo tanto constituye un universo o a en veces su resultan aplicacin

poblacin de datos desde el punto de vista estadstico. Otro universo o poblacin de datos son los pesos medidos (De los habitantes de la ciudad). Pero la poblacin de habitantes, es decir, las personas que habitan la ciudad no son la poblacin a la que nos estamos refiriendo desde el punto de vista estadstico. Supongamos que en una empresa se fabrica un lote de 10 toneladas de un producto qumico, y un tcnico debe controlar la calidad del mismo. El tcnico toma una pequea porcin, por ejemplo, 100 gramos y dir que tom una muestra del producto para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo tanto no tenemos ningn dato numrico. Cuando el laboratorio efecta algn ensayo en la muestra y obtiene un resultado numrico, dicho dato podra ser analizado desde el punto de vista estadstico. Vamos a suponer hipotticamente que el tcnico contina sacando otras muestras del producto, hasta agotar el lote y cada una es ensayada en el laboratorio, que nos da los resultados. Como tenamos 10 toneladas de producto y las muestras son

aproximadamente de 100 gramos, el tcnico seguramente extraer alrededor de 100000 muestras y el laboratorio nos entregar alrededor de 100000 resultados. Este conjunto de datos numricos es nuestro universo o poblacin de datos. Si tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de 10 elementos de ese universo o poblacin. No debemos confundir esta muestra (Desde el punto de vista estadstico) con la muestra de material que extrajo el tcnico para ser analizada en el laboratorio. Ahora bien, nuestro universo o poblacin de datos a veces no existe en la realidad, sino que es un concepto o abstraccin que utilizamos para referirnos al universo o poblacin que hipotticamente podra existir. 9

Veamos el ejemplo anterior. Supongamos que el tcnico toma solamente 5 muestras y las enva para analizar al laboratorio. El laboratorio nos enviar slo 5 resultados, y nosotros diremos que tenemos una muestra de datos extrada del universo o poblacin de datos total. Y estamos pensando en el universo o poblacin que tendramos si se hubieran extrado y analizado las 100000 muestras de material. Muchas veces resulta difcil imaginarse cual es el universo del cual extrajimos los datos. Supongamos que tenemos una mquina que produce piezas de plstico en serie y un tcnico toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es decir una muestra de 5 elementos. Cul es el universo al cual pertenece esa muestra de datos? Debemos imaginar lo siguiente: Si la mquina continuara trabajando en las mismas condiciones (Es decir, a la misma velocidad, con las mismas materias primas, a la misma temperatura, manejada por el mismo operario, etc.)...y a cada pieza que produce se le mide la altura tendramos un conjunto muy grande de resultados numricos. Ese conjunto muy grande de resultados numricos que no existe, pero que podra obtenerse en esas condiciones es el universo o poblacin del cual extrajimos la muestra de 5 observaciones. Veamos otro ejemplo. Supongamos que el sindicato de la industria textil desea saber cual es el sueldo medio de un operario en esa industria. Entonces, encarga una encuesta a una empresa especializada, que entrevista a 20 operarios de la industria textil y averigua sus salarios. Estos datos son una muestra de 20 observaciones del universo o poblacin formado por los salarios de todos los operarios de la industria textil del pas. Aunque el encuestador no disponga de esos datos, sabemos que existen miles de operarios que ganan un salario determinado y por lo tanto podemos hablar de un universo o poblacin cuyos elementos son los salarios de los operarios de la industria textil en el pas. Adems, esa poblacin de datos es seguramente diferente de la poblacin de salarios de los operarios de la industria textil inglesa o brasilea (Usando una misma moneda de referencia). 10

Qu representa una Poblacin de datos? El anlisis estadstico de una poblacin o universo de datos tiene como objetivo final descubrir las caractersticas y propiedades de aquello que gener los datos. Por ejemplo, se tiene una poblacin de escolares (Poblacin fsica, poblacin humana) y se les mide la altura. El conjunto de datos de altura constituye una poblacin o universo estadstico. El anlisis de estos datos de altura (Universo estadstico) sirve para caracterizar y estudiar a la poblacin de estudiantes (Que no es una Poblacin estadstica). Supongamos que un instituto

dedicado a estudios econmicos ha realizado una encuesta de ingresos en el pas. El universo de datos generados por la

encuesta sirve a los fines de caracterizar a la poblacin fsica, a la poblacin real del pas, desde un punto de vista econmico. Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto (Poblacin de lotes). Para cada lote se mide una caracterstica de calidad, obtenindose una gran cantidad de resultados numricos (Poblacin de datos). El ingeniero realiza esta tarea porque a travs de los datos numricos obtenidos se puede evaluar el comportamiento del proceso, que es lo que realmente le interesa.

11

Es importante destacar que detrs de un universo o poblacin de datos se encuentra una poblacin fsica subyacente, formada por elementos de la realidad que nos rodea, de la cual, a travs de algn tipo de medicin, se obtuvieron los datos numricos. Es esa poblacin fsica subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos estudiar y caracterizar por medio del anlisis estadstico de los datos obtenidos. La poblacin estadstica est representando, entonces, una poblacin fsica o natural formada por elementos de la realidad, con respecto a una caracterstica o propiedad de esa poblacin fsica. Es muy importante, al utilizar mtodos estadsticos, no confundir la poblacin fsica, formada por elementos de la realidad que estamos estudiando, con la poblacin o universo de datos generados a partir de la primera. De aqu en adelante, cuando utilicemos los trminos poblacin o universo sin otro adjetivo nos estaremos refiriendo a poblacin o universo de datos numricos (Tambin llamados observaciones, mediciones o valores). La Distribucin de Frecuencias Vimos que una Poblacin o Universo de datos es un conjunto muy grande de nmeros. Estos nmeros pueden estar en un gran listado o puede ser un conjunto hipottico, es decir, podemos imaginar los nmeros pero no los tenemos realmente. Una gran tabla de nmeros ordenados al azar prcticamente no nos muestra informacin acerca de la poblacin de datos. Suponiendo que disponemos de los datos del universo, cmo podemos 12

clasificar y ordenar los nmeros para obtener ms informacin acerca de ese universo de datos?. Una forma sera escribir los nmeros desde el menor hasta el mayor y colocar encima de cada uno tantas cruces o cuadraditos como veces que figure repetido en la poblacin. El nmero de veces que aparece repetido cada dato es la frecuencia de dicho valor. La representacin grfica que hemos visto se denomina Distribucin de Frecuencias de la poblacin. La representacin grfica nos permite ver informacin que

antes no apareca tan evidente. Por ejemplo, sin hacer ningn clculo nos damos cuenta donde est aproximadamente de la el

promedio

poblacin.

Tambin nos muestra cuales son los valores mximo y

mnimo de la poblacin, es decir, el rango o recorrido. En el caso anterior, los datos de la poblacin son nmeros enteros. Cuando los nmeros no son enteros o cuando tenemos un nmero muy grande de datos, se divide el rango total en subintervalos y se cuenta el nmero de valores que cae dentro de cada subintervalo. Vamos a suponer, ahora, que tenemos una cierta poblacin de N = 500 datos, por ejemplo el peso de varones adultos de 40 aos. Una manera de caracterizar esta poblacin es construir una distribucin de frecuencias o grfico de frecuencias. Para ello seguimos los pasos siguientes: 1) Tomamos nota del valor mximo y el valor mnimo de la serie de datos que estamos considerando.

13

2) Subdividimos el intervalo entre el mximo y el mnimo en algn nmero de intervalos (15 20) mas pequeos iguales entre s. 3) Contamos el nmero de datos que encontramos dentro de cada intervalo (Frecuencia). Por ejemplo, supongamos que en el intervalo i hay n i observaciones (S*ni = N). 4)Para construir el grfico, colocamos en el eje de abscisas (Horizontal) los intervalos y levantamos en cada intervalo un rectngulo de altura proporcional al nmero ni de datos dentro del mismo. Si hacemos el rea del rectngulo levantado sobre el intervalo i-simo igual a la frecuencia relativa ni/N, el rea total bajo el histograma ser igual a la unidad:

Obtenemos as un histograma que nos muestra la distribucin de frecuencias de la poblacin:

Esta distribucin de frecuencias nos muestra si hay resultados que son mas frecuentes que otros; si los valores estn ubicados alrededor de un valor central, si estn muy dispersos o poco dispersos. Podemos observar que fraccin de todas las mediciones cae por ejemplo, entre 70 y 80 Kg. Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la poblacin de datos representada en el grfico. Decimos, entonces, que estamos extrayendo un dato de la poblacin de datos. Pero hay

14

distintas maneras de elegir la persona, es decir, distintas maneras de realizar la extraccin del dato. Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al ms gordo, al ms flaco o al ms alto (y por lo tanto pesa ms que otros), de acuerdo a criterios subjetivos que no podemos evitar. En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la seleccin no estar influida por nuestra subjetividad. En este caso, decimos que la extraccin es aleatoria. Una extraccin aleatoria es aquella en que cada miembro de la poblacin tiene la misma posibilidad de ser elegido.

15

CAPTULO 3.- METRICA EN EL ESPACIO ESTADISTICO Medidas de tendencia central Una caracterstica importante de cualquier poblacin es su posicin, es decir, donde est situada con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un dato numrico que nos d idea de la posicin de nuestra poblacin es calcular el Promedio o Media de todas las observaciones:

Este importante parmetro nos permite efectuar comparaciones entre distintas poblaciones. Por ejemplo, si tuviramos una poblacin formada por mediciones del peso de mujeres de 30 aos, otra de peso de varones de 40 aos y una tercera de peso de nios de 8 aos, es indudable que los promedios van a ser diferentes. El promedio, entonces, nos est diciendo que las tres poblaciones son diferentes y tambin en que medida difieren. Ahora, si tuviramos una poblacin de varones con peso promedio 70 Kg. y otra poblacin de varones con el mismo promedio, se puede afirmar que ambas poblaciones son equivalentes? Para responder esta pregunta necesitamos tener medidas de la dispersin de la poblacin de datos. Medidas de Dispersin La otra caracterstica muy importante de una poblacin es el grado de dispersin de las observaciones. No es lo mismo si en nuestra poblacin encontramos que todos los valores estn entre 75 y 90 Kg. que si estn entre 60 y 105 Kg., aunque el promedio sea el mismo. Es necesario agregar alguna idea de la dispersin de los valores. Una manera es a travs del Rango de las observaciones, es decir, el valor Mximo y el valor Mnimo de los datos de la poblacin. Entonces, una descripcin mas realista acerca de los seres humanos sera decir que pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos). 16

Una manera ms precisa de dar idea de la dispersin de valores de una poblacin es a travs de la Varianza o su raz cuadrada, que es la Desviacin Standard. Vamos a calcular la varianza y la desviacin estndar de un nmero pequeo de datos (Una muestra) para ilustrar el clculo. Supongamos que se midi la altura de 10 personas adultas y de sexo femenino, y se obtuvieron los valores siguientes(en cm): 165 ; 163 ; 171 ; 156 ; 162 ; 159 ; 162 ; 168 : 159 ; 167 El promedio de estas observaciones es: = 163, 2 cm Si a cada una de las observaciones le restamos el promedio, obtenemos los Residuos:

Los residuos tambin nos dan una idea de la dispersin de las observaciones individuales alrededor del promedio. Si el valor absoluto (El valor numrico sin el signo) de los residuos es grande, es porque los valores estn muy dispersos. Si el valor absoluto de los residuos es pequeo, significa que las observaciones individuales estn muy cerca del promedio, y por lo tanto, hay poca dispersin. Pero nosotros necesitamos un slo nmero que nos provea informacin acerca de la dispersin de los valores. Si sumamos los residuos, como algunos son positivos y otros negativos, se cancelaran entre s, con lo cual perdemos la informacin acerca de la dispersin. Entonces, los elevamos al cuadrado:

Si ahora sumamos los residuos elevados al cuadrado, tenemos un nmero donde se condensa toda la informacin de la dispersin de la poblacin:

17

Este nmero, la suma de cuadrados, es dependiente del nmero de datos N, y por lo tanto no nos sirve para comparar poblaciones con distinto nmero de observaciones. Pero si dividimos la suma de cuadrados por N, tenemos un nmero que es independiente del nmero de observaciones, que se denomina Varianza:

En nuestro caso: Las frmulas anteriores son las que se aplican al clculo de la varianza y desviacin standard de una poblacin de datos. Mas adelante veremos que las frmulas a aplicar en el caso de una muestra son ligeramente diferentes. La varianza es un nmero que nos permite comparar poblaciones. Cuando la dispersin de las observaciones es grande (Datos que se alejan mucho por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el promedio) ser grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la varianza. Tambin se utiliza la raz cuadrada de la varianza:

Por lo tanto:

La desviacin estndar o desviacin tpica tiene las mismas unidades que la variable con la que estamos trabajando, en nuestro caso el centmetro. Tanto la varianza como la desviacin estndar nos permiten comparar el grado de dispersin de distintas poblaciones. Media y Varianza de una Muestra Hasta ahora hemos visto como se calcula la media o promedio de una poblacin y tambin como se calcula la varianza y la desviacin estndar de 18

una poblacin o universo de observaciones. Cuando tenemos una muestra (Subconjunto de algunos datos extrados de una poblacin), tambin podemos calcular su media, su varianza y su desviacin estndar. Es muy importante distinguir entre la media, varianza y desviacin estndar poblacional, de la media, varianza y desviacin standard muestral. La media, varianza y desviacin standard de una poblacin o universo se denominan parmetros de la poblacin y en general se designan con letras
2

poblacionales. En el caso de una muestra, la media, varianza y desviacin standard se denominan estadsticos y se utilizan letras de nuestro alfabeto: para la Media s2 s para la Varianza para la Desviacin Standard muestral

El clculo de la varianza y la desviacin standard de una muestra de n observaciones se realiza con una frmula levemente diferente que la ya vista para la varianza y desviacin standard de una poblacin:

En lugar de dividir por n, el nmero total de observaciones en la muestra, dividimos por n - 1. Este valor, n - 1, son los Grados de Libertad de la muestra. En general, cuando tenemos una muestra de n observaciones, se dice que la misma tiene n - 1 grados de libertad. La media, varianza y desviacin estndar de una muestra, en general, no van a coincidir con los mismos parmetros de la poblacin de la cual se extrajo la muestra (Aunque usemos la misma frmula para calcular la varianza muestral y poblacional). Si extraemos n muestras de una poblacin, vamos a obtener n promedios muestrales distintos del promedio de la poblacin y n varianzas muestrales distintas de la varianza de la poblacin. Esto se debe a que una poblacin o universo tienen un nmero muy grande de datos, mientras que una muestra son slo algunos pocos datos extrados de ese universo. Cuando 19

sacamos una segunda, tercera, ... etc. muestras, los datos extrados no tienen por que ser los mismos que en la primer muestra. Por lo tanto, el promedio y la varianza de las muestras van a ser distintos para las distintas muestras, y distintos de la media y la varianza de la poblacin de la cual se extrajeron las muestras. Muestreo Aleatorio En general, no es posible disponer de todas las observaciones de un universo o poblacin, ya sea porque es un universo hipottico o porque la disposicin de todos los datos resulta una tarea excesiva para nuestras posibilidades. Normalmente se dispone de una muestra de datos extrados de un universo, y lo que se pretende es estimar (Conocer de manera aproximada) los parmetros del universo por medio de clculos realizados sobre la muestra. En este sentido decimos que la media muestral es una estimacin de la media del universo, y que la varianza y desviacin estndar muestrales son estimaciones de la varianza y desviacin estndar poblacionales respectivamente. Veamos algunos ejemplos. Supongamos que un partido poltico necesita averiguar la cantidad de personas que estn dispuestas a votar por su candidato. Entonces, encarga a una empresa la realizacin de una encuesta un da previo a las elecciones. El encargado de la encuesta podra pensar en consultar la intencin de voto de toda la poblacin de votantes (Mas de 40 millones en Espaa). Esto, obviamente, es una tarea excesiva que por distintas razones no se puede realizar. Entonces, el camino que resta es tomar una muestra representativa de esa poblacin de personas y consultar la intencin de voto en esa muestra. Los resultados que se obtengan son solamente una estimacin del resultado que se hubiera obtenido si la consulta se hubiera efectuado sobre toda la poblacin de votantes. Ahora bien, cmo se obtiene una muestra representativa? Para tratar de entenderlo, vamos a trabajar con una poblacin de muy pocos datos. Supongamos que nuestra poblacin son 10 bolas con los siguientes nmeros 2, 5 y 9 y una frecuencia segn la tabla adjunta:

20

El promedio de la poblacin es 4. Supongamos que queremos obtener una muestra de 5 elementos de esa poblacin. Hay varias formas de hacerlo. Supongamos que puedo ver los nmeros y elijo 2, 2, 2, 2 y 5. El promedio de estos 5 nmeros extrados de la poblacin es 2,6 que difiere sustancialmente del promedio de la poblacin Es evidente que dicha muestra no es representativa de la poblacin de la que fue extrada. No se mantiene la misma proporcin de cada nmero que existe en la poblacin. Una muestra de 5 elementos en la que hay la misma proporcin de cada dgito debera tener 3 dos, 1 cinco y 1 nueve, y su promedio es 4, el mismo de la poblacin: En una poblacin de muchos datos, no es posible obtener una muestra eligiendo cada elemento para que figure en la misma proporcin que en la poblacin, porque para ello deberamos disponer de todos los datos de la misma, y en ese caso no sera necesario sacar una muestra. Si a cada elemento de la poblacin se le da la misma oportunidad de ser elegido, entonces se supone que cada nmero estar en la muestra en un nmero proporcional a la cantidad de veces que est en la poblacin. Por ejemplo, el 2 va a estar en la muestra mas veces que el 5, porque en la poblacin hay 6 dos y slo 2 cincos. Si introducimos las diez bolas en una bolsa y las mezclamos suficientemente, la

probabilidad que tiene una bola individual de ser extrada es la misma para cualquiera de las bolas.

21

En esas condiciones, si extraemos cinco bolas sucesivas, mezclndolas

previamente en cada oportunidad, es razonable pensar que vamos a sacar el 2 en ms oportunidades que el 5 el 9.Esta forma de obtener la muestra es lo que se conoce como Muestreo Aleatorio. El muestreo aleatorio no garantiza que la muestra va a ser representativa de la poblacin, pero al eliminar toda influencia externa en el acto de extraer un elemento de la poblacin, la proporcin de cada uno estar influida slo por la cantidad de veces que est presente en la poblacin de la cual se extrae la muestra. Entonces, realizando el

muestreo en forma aleatoria (al azar), la probabilidad de obtener una muestra representativa de la poblacin es mayor que si en la eleccin de los elementos de la muestra interviene la voluntad del que efecta la operacin o algn otro factor de influencia

22

CAPTULO 4.- FUNCIONES DE DISTRIBUCIN DE PROBABILIDADES Hemos visto como se construye un grfico de frecuencias con datos extrados de una poblacin. A medida que aumentamos la cantidad de observaciones que tomamos de la poblacin, podemos construir nuestro grfico con un nmero mayor de intervalos, aunque de menor amplitud (El rango total cubierto por la poblacin es el mismo). Si continuamos este proceso, con intervalos cada vez mas estrechos y numerosos, los altibajos en el grfico de la distribucin de

frecuencias tienden a desaparecer. En el lmite, el ancho del intervalo tiende a cero y la poblacin puede representarse por una distribucin de probabilidad continua. Cuando, para representar esta distribucin de probabilidad continua se utiliza una funcin matemtica, esta se denomina Funcin de Densidad de Probabilidad. La forma de la curva en el grfico de la funcin de distribucin es

caracterstica de la poblacin de observaciones misma, y asociada de con la

depende

variables

internas del proceso que gener los datos de la poblacin. Existen

distintas funciones de distribucin tericas, cada una de las cuales est basada en un del modelo proceso de que

comportamiento

gener el universo de observaciones. La aplicacin de una de estas distribuciones tericas a una poblacin particular est justificada si las hiptesis (suposiciones) del modelo de comportamiento 23

del proceso que gener la poblacin se cumplen. Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenmenos que dieron lugar a nuestra poblacin de mediciones u observaciones, y adems estamos seguros de que el mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la distribucin de probabilidades de nuestra poblacin es la que corresponde al modelo. n la prctica, se sabe que ciertos procesos y fenmenos generan resultados numricos cuya distribucin de probabilidades se puede ajustar a determinados modelos tericos. Por ejemplo, el nmero de partculas alfa emitidas por un material radiactivo sigue una distribucin de Poisson. xisten muchas otras distribuciones tericas, como la Binomial, la Exponencial, la de Weisbull, etc. Cada una de ellas tiene su propio campo de aplicacin, que se sostiene en un determinado comportamiento de los fenmenos, y al aplicarla se est haciendo en forma implcita la suposicin de que se cumplen las suposiciones del modelo subyacente. La Distribucin Normal Una distribucin es muy la

importante

Distribucin Normal o de Gauss. La ecuacin matemtica de la funcin de Gauss es la siguiente:

La distribucin normal es una curva con forma de campana, con eje de simetra

la desviacin estndar de la poblacin. El rea total debajo de la curva es igual a 1. El rea debajo de la curva

24

rea total: Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la distribucin normal son y (Media y desviacin standard de la poblacin). Con estos dos parmetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviacin standard). Cuando nos encontramos con una poblacin de observaciones, si podemos afirmar que la distribucin correspondiente es normal, slo hace falta estimar la media y la desviacin standard para tener toda la informacin necesaria acerca de dicha poblacin. La Distribucin Normal Standard Podemos escribir la frmula de la distribucin normal de la siguiente manera:

con Esta es la frmula de la Distribucin Normal Standard o Tipificada. Como podemos observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin standard de la poblacin. Esta funcin est tabulada. Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrndola en el 0 del eje X, y modificamos el ancho para que la desviacin standard sea 1. De esta manera tenemos

tabulada una funcin de Gauss que no depende de cual sea el promedio y la desviacin

standard de nuestra poblacin real. El cambio de variable hace que se conserve la forma de la funcin y que sirva para cualquier poblacin, siempre y cuando esa poblacin tenga una distribucin 25

normal.

Cuando queremos calcular las probabilidades para una poblacin real, calculamos Z y entramos en la tabla de la funcin normal estandard. La Distribucin T de Student En la generalidad de los casos, no disponemos de la desviacin standard de la poblacin, sino de una estimacin calculada a partir de una muestra extrada de la misma y por lo tanto no podemos calcular Z. En estos casos calculamos el estadstico T:

con

donde S es la desviacin standard muestral, calculada con n-1 grados de libertad. Ntese que utilizamos S, la Desviacin Standard de una Muestra, en lugar de de la Poblacin. El estadstico T tiene una distribucin que se denomina distribucin T de Student, que est tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calcul la desviacin standard. La distribucin T tiene en cuenta la incertidumbre en la estimacin de la desviacin standard de la poblacin, porque en realidad la tabla de T contiene las distribuciones de probabilidades para distintos grados de libertad. La distribucin T es mas ancha que la distribucin normal tipificada Para un nmero de grados de libertad pequeo. Cuando los grados de libertad tienden a infinito, la distribucin T tiende a coincidir con la distribucin normal standard. Es decir, en la medida que aumentemos el nmero de observaciones de la muestra, la desviacin standard calculada estar mas prxima a la desviacin 26

standard de la poblacin y entonces la distribucin T correspondiente se acerca a la distribucin normal standard. El uso de la distribucin T presupone que la poblacin con que estamos trabajando tiene una distribucin normal. Distribucin de Promedios Muestrales Para comprender que significa distribucin de promedios muestrales, vamos a suponer que realizamos un experimento con bombos como los usados en la lotera. Colocamos un nmero muy grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este bombo representa la poblacin de observaciones X, y tiene media m y varianza s2. Supongamos que a continuacin hacemos los siguiente: 1) Tomamos una muestra de n=10 bolas blancas. 2) Calculamos la media y la anotamos en una bola azul. 3) Colocamos la bola azul en un segundo bombo de color azul. 4) Devolvemos las bolas blancas a su bombo y le damos vueltas. 5) Repetimos toda la operacin muchas veces hasta que el bombo azul est lleno de bolas azules. Entonces, los nmeros del bombo azul forman una poblacin de promedios muestrales. Esta es una poblacin derivada de la anterior, y tiene la misma media o promedio que la distribucin original, pero su varianza es un ensimo de la varianza de la distribucin original:

En el caso del bombo azul, si denominamos tenemos:

a la media,

La distribucin de medias muestrales est situada en el mismo lugar (alrededor de la misma media) que la distribucin original, pero es mucho mas estrecha, porque su varianza es la dcima parte de la varianza original. La distribucin original de observaciones representada por el bombo blanco se denomina comnmente distribucin madre o base. Al construir la poblacin de promedios 27

muestrales, realizbamos extracciones de 10 bolas blancas despus de dar vueltas al bombo. Es decir, que estbamos realizando un muestreo aleatorio de la poblacin madre, porque cada una de las bolas blancas tena la misma posibilidad de ser elegida para integrar la muestra. Aunque la poblacin original no sea de distribucin normal, si el muestreo es aleatorio, la poblacin de promedios muestrales se aproximar a la normalidad, es decir, ser casi de distribucin normal. Este efecto se debe a un teorema de estadstica matemtica denominado Teorema Central del Lmite. En resumen, si se cumple la hiptesis de muestreo aleatorio, tenemos:

En general, en los problemas que se presentan habitualmente, existe una poblacin de observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual intentamos conocer todo lo que sea posible acerca de la poblacin de la cual fue extrada. El promedio de la muestra de n elementos pertenece a la distribucin de promedios muestrales de la poblacin original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos promedios muestrales que se distribuyen alrededor de m con desviacin standard. Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribucin de promedios con desviacin standard mas pequea, por lo cual, el promedio de la muestra estar mas cerca del promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es una estimacin del promedio del universo. Distribucin Binomial Una persona arroja un dado apostando con otra a que saca un as (un 1). La probabilidad de sacar el as es igual a:

28

Es decir que la probabilidad que tiene de acertar es 17 % aproximadamente. Ahora, supongamos que la persona arroja 5 dados iguales a la vez. Cul es la probabilidad de que saque 0, 1, 2, 3... unos?. Cuando realizamos una experiencia individual donde el resultado debe ser slo uno de dos posibles: acierto/fallo, cara/cruz, etc. decimos que es un ensayo de Bernouilli. Es tan probable sacar 1 2 ases como sacar 5 ases?. A priori parecera que no. En nuestro caso, cada vez que arrojamos un dado podemos definir nuestro

experimento registrando slo dos resultados posibles: Cada acto individual de arrojar un dado es independiente de los otros y las probabilidades de obtener un as o de no obtener ninguno, son,

respectivamente : Por lo que, cuando arrojamos 5 dados, la probabilidad de obtener 5 ases es:

Y la probabilidad de no obtener ningn As en los 5 dados arrojados es:

Nos falta calcular las probabilidades intermedias, es decir la probabilidad de obtener 1, 2, 3...ases. Es posible calcular todas estas probabilidades con una frmula binomial. Cul es la probabilidad de sacar un As al arrojar cinco dados? Por ejemplo, una forma es que salga un As en el primer dado.

29

La probabilidad de sacar 1 As en el primer dado y no sacar As en los otros cuatro es:

Pero hay 5 formas diferentes de obtener 1 As en cinco dados arrojados: que se obtenga en el 1 de los dado, o en el 2 o en el 3 o en el 4 o en el 5. Por lo tanto, la probabilidad de sacar 1 As al arrojar 5 dados es:

Cmo podemos generalizar el clculo de las distintas formas de obtener 1 As, 2 Ases, etc. en cinco dados arrojados? La respuesta la dan los nmeros combinatorios:

; donde : m! = 1*2*3**m y n! = 1*2*3**n son el factorial de m y de n respectivamente. La expresin representa el nmero de combinaciones de m elementos tomados de n en n (agrupados de n en n). Por ejemplo, si tenemos las 5 letras A, B, C, D y E, y queremos saber cuantas son todas las combinaciones posibles agrupndolas de a tres en cualquier orden: ABC, ADC,...etc., tenemos :

Y las distintas combinaciones son : ABC, ABD, ABE, ACD, ACE, ADE, BCD, BCE, BDE, CDE Supongamos que se realizan n ensayos de Bernoulli, con probabilidad p de tener un acierto, (1-p) de tener un fallo. Entonces, la probabilidad de obtener y aciertos en n ensayos de Bernouilli es:

30

Esta probabilidad es un trmino del binomio siguiente:

, donde p+q = 1 Los trminos de la suma son las probabilidades P(y), que determinan la distribucin de probabilidades de la variable aleatoria y, la cual es una variable discreta (toma los valores 0, 1, 2, ...etc.). Aplicando la frmula al caso de 5 dados:

Las probabilidades de no sacar ningn As o de sacar uno, dos, tres, cuatro o cinco, son :

Cules son los parmetros estadsticos de la variable aleatoria Y? La media es: standard resulta: En la experiencia de arrojar 5 dados: Cmo interpretamos este resultado? Si bien el promedio resulta un valor fraccionario, nos est diciendo que al arrojar los cinco dados estaremos ms cerca de sacar 1 As que de sacar 2 o ms ases. De una manera ms rigurosa, ese valor nos dice que si se repitiera la experiencia muchas veces, el promedio del nmero de ases que se obtendra en todos los experimentos sera igual a 0.83 ; la varianza es: , y, finalmente, la desviacin

La varianza de Y resulta ser

y la desviacin estndar:

Volvamos, ahora a nuestro jugador. Supongamos que arroja 5 dados y apuesta a que va a sacar 3 o ms ases, cul es la probabilidad que tiene de ganar? 31

Esta probabilidad es la suma de los trminos del binomio para 3, 4 y 5 aciertos (ases), es decir:

Lo que significa una probabilidad de ganar de aproximadamente el 3,5 %. Distribucin de Poisson Para entender la Distribucin de Poisson, vamos analizar un ejemplo detenidamente. Supongamos que se tiene una tabla rectangular de madera, de 1 metro por 1 metro, pintada con un recubrimiento sobre cuya superficie se presentan aleatoriamente pequeos defectos. Estos defectos podran ser por ejemplo partculas muy pequeas de pigmento que no fueron bien molidas al fabricar la pintura. Se desea calcular la probabilidad de que aparezcan estos defectos y para ello podramos subdividir la superficie en zonas rectangulares mas pequeas y de igual tamao :

Tenemos la superficie dividida en 4 zonas rectangulares de igual tamao. Observamos que en algunas zonas aparece un defecto superficial y en otras no. Vamos a hacer las siguientes suposiciones:

En cada zona slo puede aparecer 1 defecto. Si la probabilidad de que aparezca un defecto en todo el rea es p, la probabilidad de que aparezca un defecto en una zona es p/4.

Entonces, utilizando la Distribucin Binomial podemos calcular la probabilidad de que en nuestra superficie aparezcan 0, 1, 2, 3, 4 defectos:

32

El promedio de defectos en la superficie total ser:

Pero sabemos que en realidad en cada zona podran aparecer ms de 1 defecto. Esto hace inexacto nuestro clculo. Podramos hacer el clculo ms exacto si subdividimos las zonas:

Dividimos cada zona en 4 y ahora tenemos 16 zonas. La probabilidad de tener 1 defecto en una zona es p/16 con lo que podemos entonces calcular la probabilidad de tener 0, 1, 2, 3, ...., 16 defectos en el rea total:

Y el promedio de defectos en la superficie resulta ser el mismo que antes:

An as podran aparecer ms defectos por zona, por lo que si dividimos nuevamente cada zona en 4 tendramos 64 zonas y ahora la probabilidad de tener 1 defecto en una zona sera p/64 La probabilidad de tener 0, 1, 2, 3, ....., 64 defectos en la superficie total sera:

Y nuevamente el promedio de defectos en la superficie es p. Lo que estamos haciendo es ir aumentando n al mismo tiempo que disminuye p en igual proporcin y de ese modo, el promedio de defectos en la superficie total n.p se mantiene constante. Como vimos, al suponer que en cada subzona 33

slo puede haber 1 defecto o ningn defecto estamos cometiendo un error. Este error se hace cada vez menor, porque a medida que subdividimos el rea total se hace menos probable que en una subzona aparezca ms de un defecto. Si continuamos subdividiendo el rea indefinidamente, la frmula binomial nos dar la probabilidad de obtener 0, 1, 2, 3, ... n defectos, con n tendiendo a infinito. En el lmite, la frmula binomial tiende a la frmula de Poisson:

donde x es la variable aleatoria y

el parmetro de la distribucin de Poisson.

En el lmite, el producto de n por p, , es igual al parmetro de la distribucin:

El nmero de defectos x en la superficie total es una variable aleatoria discreta que puede tomar valores 0, 1, 2, 3, 4, ... y cuya distribucin de probabilidades se conoce como Distribucin de Poisson.

Se puede observar que la curva de la funcin de Poisson es asimtrica, como la binomial. El promedio y la varianza de esta variable aleatoria son iguales al parmetro de la distribucin:

Por lo que, la desviacin estndar es:

34

La distribucin de Poisson tiene una propiedad cuyas consecuencias son muy importantes para el Control Estadstico de Procesos. Supongamos que se tienen m variables aleatorias de Poisson:

Si w es una combinacin lineal de tales variables:

Entonces w es una variable aleatoria de Poisson con parmetro:

Esto es muy importante porque podemos imaginar el producto fabricado por un proceso (Una licuadora, una computadora, un televisor, etc.) como una superficie en la que se pueden producir mltiples defectos, y donde el nmero de cada tipo de defecto es una variable aleatoria de Poisson. Entonces, la propiedad mencionada nos permite tratar la suma de todos los tipos de defectos como una variable aleatoria de Poisson. Esto se utiliza para el control del Nmero de Defectos en un producto (Grficos C). Supongamos ahora que tenemos un gran lote de artefactos, por ejemplo licuadoras. Tomamos una muestra de m = 5 unidades y medimos el nmero total de defectos en las 5 unidades. Si obtuvimos x1, x2, x3, ... xm defectos en cada unidad, el nmero total de defectos ser:

El nmero promedio de defectos por unidad ser:

y es una variable aleatoria discreta que puede tomar valores 0, 1/m, 2/m, 3/m, ... etc. Cul es la varianza de y?

35

La varianza de xi es

cualquiera que sea el subndice i, porque todas las xi

tienen la misma distribucin; por lo tanto:

Este es un importante resultado que se utilizar para calcular la varianza en los Grficos U.

36

CAPTULO 5.- TEST DE HIPTESIS El contraste de hiptesis o test de hiptesis es una herramienta ampliamente utilizada para

comparar mediciones y tomar decisiones probabilidad. Los pasos a seguir para aplicar esta metodologa son:

basadas

en

una

Plantear unas hiptesis. Escoger un estadstico concreto.

Conocer

la

distribucin

del estadstico. Y, a partir de ah, decidir si, con los datos que poseemos de la muestra, tenemos caracterizada a la poblacin. Herramientas para contrastar hiptesis Los dos tipos de distribuciones ms importantes, aunque no nicos, para el contraste de hiptesis, son las distribuciones Normal y T-Student, que hemos visto en el captulo anterior. El contraste de hiptesis es un conjunto de reglas que nos permiten decidir cul de entre dos hiptesis debe ser aceptada como cierta en base a los resultados obtenidos en una observacin muestral. Se conocen como hiptesis nula (Ho) e hiptesis alternativa (Ha). La hiptesis nula puede mantenerse mientras los datos no indiquen su falsedad; la hiptesis nula nunca se puede afirmar , solo podremos aceptarla o rechazarla. Por lo tanto trataremos de decidir si la informacin muestral que poseemos est en consonancia con Ho, o bien nos permite rechazar esa creencia con lo que aceptaremos Ha. Podemos distinguir entre dos tipos de hiptesis: 37

Paramtricas que se refieren a conjeturas sobre el parmetro de una distribucin.

No paramtricas que responden a afirmaciones acerca de la naturaleza de la distribucin.

Regin crtica. Tipos de errores En la prctica el Contraste de Hiptesis consiste en estudiar si un estadstico que es funcin de las observaciones de la muestra est dentro de una regin llamada de aceptacin, o se encuentra en la regin de rechazo o regin crtica, de tal forma que si el estadstico se encuentra en la regin de aceptacin se aceptar la hiptesis nula y si cae en la regin de rechazo se rechazar dicha hiptesis. El estadstico muestral es un fenmeno aleatorio, por lo que pudiera pasar que aunque la Ho fuera cierta, el estadstico se encontrara en la regin de rechazo, en esta situacin estaramos cometiendo un Error de Tipo I (a). Otra posible situacin sera encontrar el estadstico en la regin de aceptacin siendo la Ho falsa, con lo que cometeramos un Error Tipo II (b). La forma de minimizar este problema es empleando muestras de tamao grande. Generalmente se procede fijando una probabilidad de error a. Al valor a se le denomina nivel de significacin y habitualmente es del 5%. Aunque existen diversos tipos de contrastes de hiptesis, nicamente explicaremos y pondremos ejemplo de dos de ellos, que son el contraste de medias y el contraste de diferencias de medias. Contraste de medias Con la notacin que habitualmente se utiliza en el contraste de hiptesis tendremos que m es la media de la poblacin, s la desviacin tpica de la poblacin, s la desviacin tpica de la muestra, n es el tamao de muestra, X la media de la muestra, y Z o t es el estadstico. Con relacin al contraste de medias, suelen emplearse dos tipos de pruebas, los test unilaterales o los test bilaterales, que tienen, respectivamente, las siguientes estructuras.

38

Ejemplo 1. Un laboratorio farmacutico afirma que el antiinflamatorio fabricado por ellos elimina la inflamacin en 14 minutos en los casos corrientes. Con el objeto de comprobar estadsticamente esta afirmacin, elegimos al azar 18 pacientes con inflamaciones varias y tomamos como variable de respuesta el tiempo transcurrido entre la administracin del antiinflamatorio y el momento en que desaparece la inflamacin. Adems, nos dicen que la variable tiempo transcurrido entre la administracin del antiinflamatorio y el momento en que desaparece la inflamacin sigue una distribucin normal de media 14 y desviacin 7. El tiempo medio de respuesta de la muestra fue de 19 minutos. Se pide comprobar la afirmacin del laboratorio a un nivel de significacin de 0.05. Solucin. Primero consideremos los datos que tenemos. X = 19, m = 14, s = 7, n = 18 Planteemos ahora las hiptesis de este test. Queremos contrastar la hiptesis nula a partir de la afirmacin de la empresa que dice que la inflamacin desaparece en 14 minutos; as pues, tendremos: Hiptesis nula Ho : m = 14

La hiptesis alternativa ser el caso desfavorable, en esta ocasin para la empresa, y puede escribirse: Hiptesis alternativa Ha : m> 14

Procederemos aceptando de entrada la hiptesis nula (m = 14), calculando el estadstico y observando si se sita en la regin crtica. Si as sucediera, rechazaramos la creencia inicial de aceptacin de la hiptesis nula. 39

Sustituyendo los parmetros de la poblacin y de la muestra en el estadstico tenemos:

Con lo que podemos observar que el estadstico se sita en la regin crtica y, por lo tanto no sigue el criterio de aceptacin de la hiptesis nula. De ese modo, rechazaramos la hiptesis Ho de que m = 14 y concluimos que a un nivel 0.05 el tiempo medio de eliminar la inflamacin por este antiinflamatorio es superior a 14 minutos. Contraste de diferencia de medias Sean X1 y X2 dos medias muestrales de dos poblaciones. Los tamaos de cada una de estas muestras son n1 y n2 respectivamente. Queremos observar si la diferencia entre las medias es significativa o no, es decir, comprobar si podemos aceptar que m 1 = m2. Tenemos:

Si las desviaciones de las poblaciones son desconocidas y slo conocemos las desviaciones muestrales, tendremos que considerar la distribucin t de Student en vez de la normal. Ejemplo 2. Se conocen los datos de dos muestras de dos poblaciones, que son los siguientes:

Se pide contrastar estadsticamente si hay diferencia entre las dos poblaciones, a un nivel de significacin del 0.05.

40

Las dos poblaciones siguen una distribucin Normal N(m1, s1) y N(m2, s2) Solucin. Sabemos que las distribuciones de las dos poblaciones son Normales, pero desconocemos el valor de su desviacin, slo conocemos el valor de la desviacin tpica de las muestras. Por ahora, planteemos las hiptesis:

Hiptesis nula

Ho : m1 - m2 = 0, es decir, m1 = m2 Ha : m1 - m2 0, es decir, m1 m2

Hiptesis alternativa

Aunque el estadstico que correspondera a este test es el asociado a una distribucin T-Student, por ser las desviaciones de las poblaciones

desconocidas, como el tamao de las muestras es elevado y sabemos que una distribucin T-Student con muchos grados de libertad se aproximaba mucho a una Normal, utilizaremos el siguiente estadstico:

Estadstico

con distribucin N(0,1)

Con los datos de la poblacin y de la muestra, calculamos el estadstico, aceptando, por ahora, la hiptesis nula (m1 = m2), y observemos en que regin se sita el estadstico.

Como podemos ver, el estadstico se sita en la regin de aceptacin de la hiptesis nula, con lo que aceptaramos la Ho (m1 = m2), y podramos concluir que, a un nivel de significacin de 0.05, las dos poblaciones se pueden considerar iguales estadsticamente. Comprobacin de la normalidad de una muestra. Muchas pruebas estadsticas estn basadas en el supuesto de que el universo del que se saca la muestra est normalmente distribuido. Por tanto, es prudente cuando sea posible, comprobar este supuesto de normalidad. Son varios los procedimientos disponibles para realizar la prueba. El mtodo ms utilizado es la prueba X2.

41

Una prueba X2 es aquella que compara un conjunto de frecuencias de muestras con el conjunto de frecuencias que cabra esperar basadas en alguna hiptesis. Si los dos grupos se comparan bien, la hiptesis se rechaza. Como la distribucin en la cual se basa la decisin de aceptar o rechazar se funda en la distribucin X2, esta prueba se denomina prueba X2. Se puede utilizar para comprobar la adecuacin de cualquier curva de frecuencia. En nuestro caso la hiptesis es que la distribucin de frecuencias sigue una distribucin Normal La formulacin precisa de una prueba X2 es la siguiente; supongamos que F1, F2,, Fk sean las frecuencias de muestra de k clases y f1, f2, ; fk las frecuencias que se esperaran con base en la hiptesis de normalidad. En tal caso, si Ho es cierto, los valores de muestra de la cantidad

tendern a formar una distribucin X2, de parmetro v. Al aplicar una prueba X2 para determinar la normalidad de una distribucin, las frecuencias reales de un histograma se comparan con las frecuencias tericas obtenidas, suponiendo que el universo est normalmente distribuido. Se adapta la curva normal dndole las mismas medias y desviacin estandar del histograma de la muestra. Las frecuencias tericas y reales se comparan en la forma que se describe mediante la frmula anterior, y la tabla X 2 se utiliza entrando con v = k-3, siendo k el nmero de intervalos elegidos en el diagrama de frecuencias. El proceso de adaptacin impone a continuacin las tres condiciones siguientes:

Utilizando la nomenclatura usada en estadstica matemtica, decimos que estas tres condiciones ocasionan una prdida de tres grados de libertad.

42

CAPTULO 6.- MANUAL DE CONTROL ESTADSTICO DE PROCESOS Introduccin Un sistema de control del proceso puede definirse como un sistema de realimentacin de la informacin en el que hay 4 elementos fundamentales: Proceso Por proceso entendemos la combinacin global de personas, equipo, materiales utilizados, mtodos y medio ambiente, que colaboran en la produccin. El comportamiento real del proceso -la calidad de la produccin y su eficacia productiva- dependen de la forma en que se dise y construy, y de la forma en que es administrado. El sistema de control del proceso slo es til si contribuye a mejorar dicho comportamiento. Informacin Sobre el Comportamiento El proceso de produccin incluye no solo los productos producidos, sino tambin los estados intermedios que definen el estado operativo del proceso tales como temperaturas, duracin de los ciclos, etc. Si esta informacin se recopila e interpreta correctamente, podr indicar si son necesarias medidas para corregir el proceso o la produccin que se acaba de obtener. No obstante, si no se toman las medidas adecuadas y oportunas, todo el trabajo de recogida de informacin ser un trabajo perdido. Actuacin Sobre el Proceso Las actuaciones sobre el proceso estn orientadas al futuro, ya que se toman en caso necesario para impedir que ste se deteriore. Estas medidas pueden consistir en la modificacin de las operaciones (por ejemplo, instrucciones de operarios, cambios en los materiales de entrada, etc) o en los elementos bsicos del proceso mismo (por ejemplo, el equipo -que puede necesitar mantenimiento, o el diseo del proceso en su conjunto- que puede ser sensible a los cambios de temperatura o de humedad del taller). Debe llevarse un control sobre el

43

efecto de estas medidas, realizndose ulteriores anlisis y tomando las medidas que se estimen necesarias. Actuacin sobre la Produccin

Las actuaciones sobre la produccin estn orientadas al pasado, porque la misma implica la deteccin de productos ya producidos que no se ajustan a las especificaciones. Si los productos fabricados no satisfacen las especificaciones, ser necesario clasificarlos y retirar o reprocesar aquellos no conformes con las especificaciones. Este procedimiento deber continuar hasta haberse tomado las medidas correctoras necesarias sobre el proceso y haberse verificado las mismas, o hasta que se modifiquen las especificaciones del producto. Es obvio que la inspeccin seguida por la actuacin nicamente sobre la produccin es un pobre sustituto de un rendimiento eficaz del proceso desde el comienzo. El Control del Proceso centra la atencin en la recogida y anlisis de informacin sobre el proceso, a fin de que puedan tomarse medidas para perfeccionar el mismo. Hay dos formas diferentes de diseo y anlisis de sistemas de control que utilizan herramientas estadsticas :

Control Estadstico de Proceso (CEP) del que trata este manual.

44

Control adaptativo, que utiliza lazos de retroalimentacin para predecir futuros valores de las variables de proceso. Este control dice cuando hay que corregir para mantener a las variables con oscilaciones mnimas alrededor de los valores objetivos y est basado en el Anlisis de series Temporales (Box-Jenkins).

Este tipo de control puede implementarse mediante sistemas de control automtico digital (caso ms habitual) o mediante grficos de control. En o sucesivo nos referiremos nicamente al Control Estadstico del Proceso. Control Estadstico de Procesos (C.E.P) El CEP es una herramienta estadstica que se utiliza en el puesto de trabajo para conseguir el producto adecuado y a la primera. Los grficos de control constituyen el procedimiento bsico del C.E.P. Con dicho procedimiento se pretende cubrir 3 objetivos - Seguimiento y vigilancia del proceso - Reduccin de la variacin - Menos costo por unidad En cualquier proceso productivo, por muy bien que se disee y por muy cuidadosamente que se controle, siempre existir una cierta variabilidad inherente, natural, que no se puede evitar. Esta variabilidad nat ural, este ruido de fondo, es el efecto acumulado de muchas pequeas causas de carcter, esencialmente, incontrolable. Cuando el ruido de fondo sea relativamente pequeo consideraremos aceptable el nivel de funcionamiento del proceso y diremos que la variabilidad natural es originada por un sistema estable de causas de azar. Un proceso sobre el que solo actan causas de azar se dice que est bajo control estadstico. Por el contrario, existen otras causas de variabilidad que pueden estar, ocasionalmente, presentes y que actuarn sobre el proceso. Estas causas se derivan, fundamentalmente, de tres fuentes:

Ajuste inadecuado de las mquinas Errores de las personas que manejan las mquinas

45

Materia prima defectuosa.

La variabilidad producida por estas causas suele ser grande en comparacin con el ruido de fondo y habitualmente sita al proceso en un nivel inaceptable de funcionamiento. Denominaremos a estas causas causas asignables y diremos que un proceso funcionando bajo causas asignables est fuera de control. Un objetivo fundamental del C.E.P. es detectar rpidamente la presencia de causas asignables para emprender acciones correctoras que eviten la fabricacin de productos defectuosos. Alcanzar un estado de control estadstico de proceso puede requerir un gran esfuerzo pero es slo el primer paso. Una vez alcanzado, podremos utilizar la informacin de dicho control como base para estudiar el efecto de cambios planificados en el proceso de produccin con el objetivo de mejorar la calidad del mismo. La Operacin Evolutiva es un tipo de Diseo de Experimentos en lnea (aplicado al proceso productivo) que sirve como herramienta para acercarnos a las condiciones ptimas de funcionamiento del proceso. Grficos CEP. Generalidades Los grficos de control o cartas de control son una importante herramienta utilizada en control de calidad de procesos. Bsicamente, una Carta de Control es un grfico en el cual se representan los valores de algn tipo de medicin realizada durante el funcionamiento de un proceso continuo, y que sirve para controlar dicho proceso. Vamos a tratar de entenderlo con un ejemplo. Supongamos que tenemos una mquina de inyeccin que produce piezas de plstico, por ejemplo de PVC. Una caracterstica de calidad importante es el peso de la pieza de plstico, porque indica la cantidad de PVC que la mquina inyect en la matriz. Si la cantidad de PVC es poca la pieza de plstico ser deficiente; si la cantidad es excesiva, la produccin se encarece porque se consume ms materia prima.

46

En el lugar de salida de las piezas, hay un operario que cada 30 minutos toma una, la pesa en una balanza y registra la observacin. Supongamos que estos datos se registran en un grfico de lneas en funcin del tiempo:

Observamos una lnea quebrada irregular, que nos muestra las fluctuaciones del peso de las piezas a lo largo del tiempo. Esta es la fluctuacin esperable y natural del proceso. Los valores se mueven alrededor de un valor central (El promedio de los datos), la mayor parte del tiempo cerca del mismo. Pero en algn momento puede ocurrir que aparezca uno o ms valores demasiado alejados del promedio. Cmo podemos distinguir si esto se produce por la fluctuacin natural del proceso o porque el mismo ya no est funcionando bien? El control estadstico de procesos provee la respuesta a la anterior pregunta y a continuacin veremos como lo hace. Todo proceso de fabricacin funciona bajo ciertas condiciones o variables que son establecidas por las personas que lo manejan para lograr una produccin satisfactoria.

47

Cada uno de estos factores est sujeto a variaciones que realizan aportes ms o menos significativos a la fluctuacin de las caractersticas del producto, durante el proceso de fabricacin. Los responsables del funcionamiento del proceso de fabricacin fijan los valores de algunas de estas variables, que se denominan variables controlables. Por ejemplo, en el caso de la inyectora se fija la temperatura de fusin del plstico, la velocidad de trabajo, la presin del pistn, la materia prima que se utiliza (Proveedor del plstico), etc. Proceso bajo control estadstico Un proceso de fabricacin es una suma compleja de eventos grandes y pequeos. Hay una gran cantidad de variables que sera imposible o muy difcil controlar. Estas se denominan variables no controlables. Por ejemplo, pequeas variaciones de calidad del plstico, pequeos cambios en la velocidad del pistn, ligeras fluctuaciones de la corriente elctrica que alimenta la mquina, etc. Los efectos que producen las variables no controlables son aleatorios. Adems, la contribucin de cada una de dichas variables a la variabilidad total es cuantitativamente pequea. Son las variables no controlables las responsables de la variabilidad de las caractersticas de calidad del producto. Los cambios en las variables controlables se denominan Causas Asignables de variacin del proceso, porque es posible identificarlas. Las fluctuaciones al azar de la variables no controlables se denominan Causas No Asignables de variacin del proceso, porque no son pasibles de ser identificadas. Causas Asignables: Son causas que pueden ser identificadas y que conviene descubrir y eliminar, por ejemplo, una falla de la mquina por desgaste de una pieza, un cambio muy notorio en la calidad del plstico, etc. Estas causas provocan que 48

el proceso no funcione como se desea y por lo tanto es necesario eliminar la causa, y retornar el proceso a un funcionamiento correcto. Causas No Asignables: Son una multitud de causas no identificadas, ya sea por falta de medios tcnicos o porque no es econmico hacerlo, cada una de las cuales ejerce un pequeo efecto en la variacin total. Son inherentes al proceso mismo y no pueden ser reducidas o eliminadas a menos que se modifique el proceso. Cuando el proceso trabaja afectado solamente por un sistema constante de variables aleatorias no controlables (Causas no asignables) se dice que est funcionando bajo Control Estadstico. Cuando, adems de las causas no asignables, aparece una o varias causas asignables, se dice que el proceso est fuera de control. El uso del control estadstico de procesos implica algunas hiptesis que describiremos a continuacin: 1) Una vez que el proceso est en funcionamiento bajo condiciones establecidas, se supone que la variabilidad de los resultados en la medicin de una caracterstica de calidad del producto se debe slo a un sistema de causas aleatorias, que es inherente a cada proceso en particular. 2) El sistema de causas aleatorias que acta sobre el proceso genera un universo hipottico de observaciones (mediciones) que tiene una Distribucin Normal. 3) Cuando aparece alguna causa asignable provocando desviaciones adicionales en los resultados del proceso, se dice que el proceso est fuera de control. La funcin del control estadstico de procesos es comprobar en forma permanente si los resultados que van surgiendo de las mediciones estn de acuerdo con las dos primeras hiptesis. Si aparecen uno o varios resultados que contradicen o se oponen a las mismas, es necesario detener el proceso, encontrar las causas por las cuales el proceso se apart de su funcionamiento habitual y corregirlas.

49

La puesta en marcha de un programa de control estadstico para un proceso implica dos etapas:

Antes de pasar a la segunda etapa, se verifica si el proceso est ajustado. En caso contrario, se retorna a la primera etapa. En la 1 etapa se recogen unas 100-200 mediciones, con las cuales se calcula el promedio y la desviacin estndar:

Luego se calculan los Lmites de Control de la siguiente manera: Lmite inferior = - 3,09s ; Lmite superior = + 3,09s

Estos lmites surgen de la hiptesis de que la distribucin de las observaciones es normal. En general se utilizan lmites de 2 sigmas de 3 sigmas alrededor del promedio. En la distribucin normal, el intervalo de 3,09 sigmas alrededor del promedio corresponde a una probabilidad de 0,998.

Se construye un grfico de prueba y se traza una lnea recta a lo largo del eje de ordenadas (Eje X), a la altura del promedio (Valor central de las observaciones) y otras dos lneas rectas a la altura de los lmites de control. En el grfico de prueba se representan los puntos correspondientes a las observaciones con las que se calcularon los lmites de control y se analiza 50

detenidamente para verificar si est de acuerdo con la hiptesis de que la variabilidad del proceso se debe slo a un sistema de causas aleatorias o si, por el contrario, existen causas asignables de variacin. Esto se puede establecer porque cuando la fluctuacin de las mediciones se debe a un sistema constante de causas aleatorias la distribucin de las observaciones es normal: Cuando las observaciones sucesivas tienen una distribucin normal, la mayor parte de los puntos se sita muy cerca del promedio, algunos pocos se alejan algo ms y prcticamente no hay ninguno en las zonas ms alejadas. Es difcil decir como es el grfico de un conjunto de puntos que siguen un patrn aleatorio de distribucin normal, pero s es fcil darse cuenta cuando no lo es. Veremos algunos ejemplos de patrones No Aleatorios en el captulo 7. Si no se descubren causas asignables entonces se adoptan los lmites de control calculados como definitivos, y se construyen cartas de control con esos lmites.

Si slo hay pocos puntos fuera de control (2 3), estos se eliminan, se re calculan la media, desviacin estndar y lmites de control con los restantes, y se construye un nuevo grfico de prueba. Cuando las observaciones no siguen un patrn aleatorio, indicando la existencia de causas asignables, se hace necesario investigar para descubrirlas y eliminarlas. Una vez hecho esto, se debern recoger nuevas observaciones y calcular nuevos lmites de control de prueba, comenzando otra vez con la primera etapa. 51

En la 2 etapa, las nuevas observaciones que van surgiendo del proceso se representan en el grfico, y se controlan verificando que estn dentro de los lmites, y que no se produzcan patrones no aleatorios. Como hemos visto, el 99,8 % de las observaciones deben estar dentro de los lmites de 3,09 sigmas alrededor de la media. Esto significa que slo una observacin en 500 puede estar por causas aleatorias fuera de los lmites de control. Cuando se encuentra ms de un punto en 500 fuera de los lmites de control, significa que el sistema de causas aleatorias que provocaba la variabilidad habitual de las observaciones ha sido alterado por la aparicin de una causa asignable que es necesario descubrir y eliminar. En ese caso, el supervisor del proceso debe detener la marcha del mismo e investigar con los que operan el proceso hasta descubrir la(s) causas que desviaron al proceso de su comportamiento habitual. Una vez eliminadas las causas del problema, se puede continuar con la produccin normal. Estos lmites de control se escogen de forma que si el proceso est bajo control, prcticamente todos los puntos del grfico estarn contenidos entre dichos lmites. En tanto los puntos estn dentro de los limites no ser precisa ninguna accin correctora porque se supone que el proceso est balo control. Sin embargo, un punto fuera de los lmites de control se interpreta como una evidencia de que el proceso est fuera de control debiendo investigarse la naturaleza de la causa o causas asignables presentes a fin de eliminarlas, adoptando la oportuna medida correctora. Si el proceso est bajo control, adems de situarse los puntos dentro de los lmites de control, todos los puntos del grfico presentarn una posicin originada por el azar sin la presencia de patrones especiales de variabilidad. IMPORTANTE: No hay que confundir los lmites de control con los lmites de tolerancia.

52

Los lmites de tolerancia son los valores de una que determinada valores

caracterstica

separan

correctos e incorrectos de la misma (fijados normalmente por el proyectista para que el producto funcione

adecuadamente) Los lmites de control son aquellos entre los cuales el estadstico

considerado (sean valores individuales, medias, medianas, recorridos desviaciones tpicas, sumas acumuladas, etc.) tiene una probabilidad muy alta de situarse cuando el proceso est bajo control (no hay causa asignable). Cuando un proceso (que suponemos sigue una distribucin Normal) se desplaza respecto a sus valores nominales o aumenta su dispersin, genera ms elementos defectuosos (ms elementos fuera de los lmites de tolerancia). Variables y atributos Los grficos de control se clasifican en dos tipos: Variables y Atributos. Si la caracterstica dc calidad puede medirse y expresarse como un nmero la llamamos variable. En tales casos es conveniente describir la caracterstica de calidad con una medida de tendencia central y una medida de dispersin mediante los llamados grficos de control por variables, que veremos en el captulo 7. Los grficos X son los ms ampliamente utilizados para controlar la tendencia central mientras que los grficos de rango (recorrido) y de desviacin tpica se utilizan para controlar la dispersin. Muchas caractersticas cualitativas no se miden en una escala cuantitativa. En estos casos, juzgaremos si una unidad de producto es o no conforme si posee ciertos atributos o contando el nmero de defectos que aparecen en cada unidad de producto. Los grficos de control para estas caractersticas se denominan grficos de control por atributos, que veremos en otro de los captulos.

53

Eficacia estadstica de los grficos de control El objetivo bsico de un grfico de control es detectar, de la forma ms rpida posible, cambios en el proceso. Cuando un punto cae fuera de los lmites de control decimos que el proceso est fuera de control, que existe una causa asignable. Realmente, como en cualquier contraste de hiptesis estadstico existe una probabilidad de dictaminar una situacin fuera de control cuando el proceso est realmente bajo control (error tipo I) as como una probabilidad de (error tipo II) de decir que el proceso est bajo control (puntos entre lmites de control) cuando realmente el proceso est fuera de control. Al disear el grfico tenemos presente estos dos errores, que determinan la eficacia estadstica del mismo. Dicha eficacia viene recogida en dos curvas: Curva ARL (Longitud de racha media). Indica el nmero medio de muestras necesario para detectar un cambio en el proceso de magnitud determinada. Es la principal caracterstica del grfico ya que nos mide la rapidez de respuesta del mismo.

Como se observa en la curva ARL, si no hay descentrado (d =0), tambin hay puntos fuera de lmites (falsas seales o error tipo I) Curva caracterstica. Da la probabilidad de que el siguiente punto caiga dentro de tos lmites de control para un cambio en el proceso de magnitud determinada. Para disear un grfico de control con una eficiencia estadstica determinada fijaremos:

54

A) Separacin de lmites de control. Cuanto ms alejados estn uno de otro el error tipo I ser menor y aumentar el tipo II B) Tamao de la muestra. Al aumentar el tamao de la muestra el error tipo II disminuye Subgrupos racionales El concepto de subgrupo racional es una idea fundamental para el uso de grficos de control debida a Shewhart. De acuerdo con este concepto, la muestra (subgrupo racional) debe tomarse de tal forma que si la causa asignable est presente, la probabilidad de aparicin de diferencias significativas dentro de los subgrupos se minimice. Dicho de otra forma, los subgrupos deben elegirse de forma que tengan la mxima probabilidad de que las mediciones realizadas en cada subgrupo sean semejantes y la mxima probabilidad de que los subgrupos se diferencien entre si. El principal esfuerzo ha de centrarse en garantizar que las unidades de cada subgrupo se producen, esencialmente, bajo las mismas condiciones. Cuando los grficos de control se aplican a los procesos de produccin, el orden de produccin ser una base lgica para el agrupamiento en subgrupos racionales. An cuando se respete el orden de produccin es posible formar subgrupos errneamente. Los subgrupos se realizan agrupando las mediciones de tal modo que haya la mxima variabilidad entre subgrupos y la mnima variabilidad dentro de cada subgrupo. Por ejemplo, si se toman unas observaciones de una muestra al final de un turno y las restantes al comienzo de! siguiente, entonces podran no ser detectados algunos cambios. Supongamos piezas una fbrica para que la produce industria

cilndricas

automotriz. La caracterstica de calidad que se desea controlar es el dimetro de las piezas. Existen dos caminos para formar subgrupos racionales. Una de ellas es retirar varias 55

piezas juntas a intervalos regulares, por ejemplo cada hora. Este mtodo se utiliza cuando el propsito fundamental del grfico de control es detectar cambios de nivel del proceso. La otra forma es retirar piezas individuales a lo largo del intervalo de tiempo correspondiente al subgrupo.

Este mtodo se utiliza sobre todo cuando los grficos se emplean para tomar decisiones respecto de la aceptacin de todas las unidades producidas desde la ltima muestra. Por cualquiera de los dos caminos, obtenemos grupos de igual nmero de mediciones. Si tomamos muestras segn el primer mtodo en un proceso que puede cambiar a una situacin de fuera de control y volver de nuevo dentro de control en el perodo comprendido entre muestras, entonces, no detectaramos la produccin defectuosa, por lo que sera mas adecuado utilizar el segundo mtodo. Hacemos notar, sin embargo, que cuando se forman subgrupos de esta segunda forma, los grficos de control para la dispersin (rango y sigmas) requieren una cuidadosa interpretacin ya que es posible la aparicin de puntos fuera de control an cuando no existan cambios en la variabilidad del proceso. Existen otras bases para formar subgrupos racionales: Diferentes mquinas, distintos trabajadores, etc. A veces, por ejemplo, ser preciso realizar un grfico de control para cada mquina.

56

CAPTULO 7.- GRAFICOS DE CONTROL POR VARIABLES Introduccin. Grficos basados en un estudio inicial Muchas caractersticas de calidad pueden expresarse en trminos de medida numrica. Por ejemplo, el dimetro de una pieza puede medirse con un micrmetro y expresarse en milmetros. Una caracterstica cualitativa que sea medible tal como un volumen, un peso, o cualquier dimensin, en general, es una variable. Cuando nos referimos a una variable, es una prctica normal el controlar tanto el valor medio como la dispersin. El control del valor medio se realiza, habitualmente, con el grfico de control para medias, o grfico . El control de

la dispersin puede efectuarse bien con el grfico de control de la desviacin tpica (grfico S) o con el grfico de control de rangos (grfico R). El uso del grfico R est ms extendido que el del grfico S. Debemos sealar que es necesario mantener el control sobre ambos: Media y dispersin del proceso. La figura 2 representa la situacin de un proceso. En a) tanto la media m como la desviacin tpica s estn bajo control a sus valores nominales (m o, so) y en consecuencia la mayor parte de la produccin del proceso cae dentro de los lmites de especificacin. En la figura b) la media se ha trasladado m
1

> mo dando como resultado una cierta fraccin de la

produccin fuera de especificacin. En la figura c) la desviacin tpica ha cambiado s


1

> so lo que origina tambin que un parte de la produccin est

fuera de norma.

57

Los grficos X-R se utilizan cuando la caracterstica de calidad que se desea controlar es una variable continua. A.- Grfico de la media Supongamos que una variable est normalmente distribuida con media m y desviacin tpica s y que ambas son conocidas. Si X1, X2,... son mediciones de una muestra de tamao n, la media muestral, dada por:

est normalmente distribuida con media m y desviacin tpica Adems, la probabilidad de que cualquier media muestral caiga en el intervalo

es 1 - a, siendo a el error tipo I o Nivel de significacin (probabilidad de decir que el proceso se ha descorregido cuando en realidad el proceso sigue la distribucin N(m , s)),

58

Por consiguiente, si m y s son conocidos la expresin anterior puede utilizarse para determinar los lmites de control de la media muestral. Habitualmente usaremos los lmites 3s reemplazando Za/2 por 3. Si la media muestral cae fuera de estos lmites, esto indicar que la media del proceso no permanece en m.

Hemos supuesto que la distribucin original era normal. Si no lo fuera, los anteriores resultados seran tambin aproximadamente vlidos por aplicacin del teorema central del lmite.

En la prctica no conocemos m ni s, por consiguiente, debemos estimarlas a partir de muestras previas obtenidas del proceso cuando se cree que ste est bajo control. Esta estimacin debe basase como mnimo en 20 o 25 muestras. Supongamos que disponemos de (m) muestras, cada una de ellas con (n) observaciones. Tpicamente, n ser pequeo 4 5. En esa situacin, el mejor estimador de la media del proceso ser

se utilizar como valor de la lnea central del grfico. Para construir los lmites de control, necesitamos un estimador de la desviacin tpica s. Podemos estimar s a partir de los rangos o de las desviaciones tpicas de las (m) muestras. De momento, haremos la estimacin a partir de los rangos. Si X1, X2,..., Xn, son mediciones de una muestra de tamao n, el rango de la muestra es R =Xmax - Xmin. La variable aleatoria W = R/s sigue una distribucin conocida denominada distribucin del rango relativo. Los parmetros de esta distribucin son funcin del tamao de muestra (n). La media de W es (d2) y la desviacin tpica (d3). En

59

consecuencia, un estimador de s es R/d2. Los valores de d2 estn tabulados (Tablas II y III). Si

la mejor estima de s ser Cuando el tamao de la muestra es pequeo: n = 4 5 el mtodo de estimar a partir del rango da casi tan buen resultado como estimarla a partir de la varianza muestral. Sin embargo, para valores de n, digamos no mayores de 10, pierde rpidamente eficiencia ya que ignora toda la informacin comprendida entre Xmax y Xmin. Si usamos como estimador de m y como estimador de s entonces los

lmites de control del grfico de medias quedaran:

Za/2 lo obtendramos de las tablas de Distribucin Normal (Tabla I), una vez elegido a (error tipo I). Normalmente Za/2 = 3 (a = 0,0027), en este caso la cantidad tabulada y el calculo de los lmites de control da: esta

Grficos basados en valores estndar Cuando es posible especificar valores desviacin tpica del proceso, usaremos lmites de control del grfico , R, sin Supongamos que los estndar dados

son m y s. Entonces los parmetros del grfico son :

donde a es el error tipo I elegido. Normalmente Za/2 = 3 (a = 0,0027), la cantidad ,que solo depende de

n, esta tabulada en la tabla I, por lo que los parmetros quedarn : 60

Para construir el grfico R con un valor estndar s, tendremos en cuenta los valores tabulados d2 y d3 que son, respectivamente, el valor central y la desviacin tpica de la distribucin del rango relativo W = R/s. Por consiguiente, (utilizando el criterio 3 sR) los parmetros sern :

Tambin estn tabulados los valores :

con lo que los lmites de control sern

Si definimos un error tipo I determinado, utilizamos las tablas de la distribucin del rango relativo para calcular los lmites. La utilizacin de los grficos basados en valores estndar debe ejercerse con cuidado ya que puede ser que estos valores no sean realmente aplicables al proceso y que, en consecuencia, resulten muchos puntos fuera de control. Si el proceso est en realidad bajo control para una media y unas desviaciones tpicas diferentes podemos gastar un esfuerzo considerable en buscar causas asignables inexistentes. En aquellos procesos en los que la caracterstica cualitativa se controle mediante ajustes de la mquina este tipo de grficos suele dar buenos resultados para conseguir los objetivos propuestos. Ejemplo.- Supongamos que una especificacin seala que debemos fabricar un material granular de dimetro exterior 10,8 0,2 mm y que nos aceptan alrededor de 5.5% de granos defectuosos.

61

El colectivo debe seguir una Distribucin Normal de media 10,8 y s = 0,1 (si queremos dejar cuando el proceso est centrado un 4% (<5,5) de granos

defectuosos. Para elegir el grfico de control de medias muestrales: Elijo a (Probabilidad de detectar un cambio en el proceso cuando en realidad no se ha producido, error tipo 1).a = 2. 7 o/oo (criterio 3s). Elijo n (tamao de la muestra). Con el tamao de la muestra controlo el error tipo II (Probabilidad de no detectar cambios en el proceso cuando los hay). Ver curvas

caractersticas y ARL en el punto. 2.2.2. Normalmente n = 5.

Para elegir el grfico de control del recorrido: Elijo el error tipo I, por ejemplo a = 2. 7o/oo. luego 1-a = 0,9975. En la tabla de la distribucin del rango relativo (tablas II y III), para n = 5 obtengo y = 5,25, luego LSC = 5,25 x 0,1 = 0,52 Lneas generales para el diseo del grafico Para disear el grfico ,R

, R debemos especificar el tamao de muestra, la

amplitud de los lmites de control y la frecuencia del desmuestre. Sin una detallada informacin de los factores econmicos y estadsticos que afectan al problema, no puede darse una solucin exacta al diseo del grfico de control. Una solucin completa exige conocer el coste del desmuestre, el coste de investigar y corregir el proceso cuando est fuera de control y el coste asociado con producir fuera de los lmites especificados. Sin embargo, pueden darse unas lneas generales para el diseo. 62

Si el grfico

se quiere utilizar para detectar cambios relativamente grandes

(del orden de 2 ) son suficientemente efectivos tamaos de muestra n = 4 a 6. Si lo que deseamos es detectar cambios ms pequeos puede ser necesario aumentar el tamao de muestra hasta n = 15 25. Cuando se toman muestras pequeas existe menor riesgo de que el cambio se produzca en el curso de la toma de muestra. Si el cambio tiene lugar durante el desmuestre la media muestral no reflejar debidamente el cambio por estar influida por las restantes observaciones. De ah un argumento para utilizar un tamao de muestra tan pequeo como sea posible pero que a la vez sea suficiente para detectar un cambio de la magnitud requerida. Una alternativa a incrementar el tamao de muestra es utilizar lmites de atencin. El grfico A es relativamente insensible a los cambios en la desviacin tpica para pequeas muestras. Por ejemplo muestras del tamao n = 5 solo tienen una probabilidad de detectar de aproximadamente el 40% en la primera muestra, un cambio en la desviacin tpica del proceso de s a 2s. Con tamaos de muestra mayores, la efectividad sera mayor pero tambin seria A peor estimador de a por lo que sera ms conveniente para n = 10 utilizar los grficos S en lugar del R. Desde el punto de vista estadstico las curvas ARL de los grficos , R son un poderoso auxiliar para escoger el tamao de muestra.

Por ser, casi siempre, limitados los recursos que pueden emplearse en el desmuestre, las estrategias posibles consistirn en tomar pequeas muestras a intervalos cortos o grandes muestras de menor frecuencia. No se puede dar una regla general para todos los casos, aunque la tendencia en la prctica industrial es la de tomar pequeas y frecuentes muestras. La percepcin ms generalizada es que si el intervalo entre desmuestres es demasiado grande puede producirse un porcentaje elevado de producto defectuoso antes de que se detecte el cambio en el proceso. Desde el punto de vista econmico, s el coste asociado con la produccin de unidades defectuosas es elevado es tambin mejor tomar muestras pequeas y frecuentes que muestras de mayor tamao ms espaciadas.

63

El ratio de produccin tambin influye en la frecuencia y tamao de la muestra. A mayor produccin/hora, mayor frecuencia de desmuestre. Si el coste de desmuestre y de la mediacin no son excesivos los procesos de elevado ratio de produccin se desmuestran con tamaos de muestra mayores n = 15/25. El uso de lmites de control 3s en los grficos , R es la prctica ms

ampliamente extendida. Existen, sin embargo, situaciones en las que es conveniente adoptar otros criterios. Por ejemplo, si las falsas alarmas (errores de tipo II son muy costosas de investigar puede ser mejor utilizar lmites de control a 4s. Por el contrario, si para un determinado proceso las seales de fuera de control son rpida y fcilmente investigadas puede ser mejor colocar los lmites de control a 2 s.

Interpretacin de los grficos

,R

Una vez desarrolladas las tcnicas para el clculo de los grficos de control conviene establecer unas pautas generales tendentes a ayudar a la "lectura de los grficos", con vistas a obtener el mximo provecho de ellos. a) Generales Los grficos de control pueden indicar una situacin fuera de control an sin existir puntos fuera de los lmites de control cuando los puntos representados sigan pautas distintas al comportamiento aleatorio. En algunos casos estas pautas pueden utilizarse para realizar modificaciones que reduzcan la variabilidad del proceso (objetivo bsico del C.E.P.) Para interpretar pautas en el grfico es preciso antes asegurarse de que el

grfico R est bajo control. Lo primero ser, pues, eliminar las causas asignables correspondientes al grfico R. Esto, en muchos casos, eliminar automticamente las pautas del grfico .

Normalmente slo interesan los puntos fuera de los intervalos. Estos debern marcarse o destacarse (por ejemplo, con un crculo rojo). Los puntos que estn muy cerca de las lneas de control conviene marcarlos con un semicrculo (rojo, cuando estn fuera y negro cuando caen dentro.

64

No es conveniente dedicar demasiada atencin al movimiento de los puntos dentro de los lmites de control, excepto en los casos de sesgo y tendencia que veremos mas adelante. Se considera que el proceso est en estado controlado cuando:

25 puntos consecutivos caen dentro de los lmites de control

En 100 puntos consecutivos no hay ms de 2 que caen fuera de lmites de control

No obstante hay que investigar y corregir la anomala. Se considera, tambin, que hay anomala en el proceso cuando varios puntos caen al mismo lado de la lnea central:

7 o ms puntos consecutivos

10 de 11 puntos consecutivos

12 de 14 puntos consecutivos los puntos caen masivamente entorno a la lnea central

Cuando

(sobrestabilidad), deben analizarse las causas (pues suponen una mejora) para intentar hacerlas permanentes. Los cambios en el grfico de no tienen porque reflejarse en el de R. Sin

embargo, un cambio en la variabilidad (R), si que suele traducirse en cambios en el de medias ( ).

Los cambios de turnos (operarios), de materias primas, etc. pueden dar lugar a periodicidades (ciclos). Cuando hay grandes-fluctuaciones en los puntos, suele deberse al mal manejo o falta de entrenamiento o inters del operario u operarios. b) Aspectos especficos de los grficos R Un punto que sobrepasa el lmite superior puede indicar:

65

La variabilidad del proceso ha empeorado

Cambio de persona o instrumento de medida

En todos los casos en los que un punto cae fuera de los lmites de control (superior o inferior), hay que comprobar antes de cualquier accin:

Que el punto ha sido bien marcado

Que los lmites han sido bien calculados

Frecuentemente, pueden detectarse cambios anormales del proceso antes de que este se salga de los lmites de control. Estos cambios son advertidos por un Sesgo en el grfico, como ocurre en el caso de que 7 o ms puntos sucesivos caigan en el lado superior de la lnea central, sin salirse de los lmites.

Un "sesgo" significa mayor variabilidad en la produccin (cambio de lote de producto, avera de mquina, etc.) Cuando el sesgo est por debajo de la lnea central R, esto indica MENOR variabilidad en el proceso, lo que es indicador de una mejora, que debe ser estudiada para intentar hacerla permanente. A ttulo orientativo un 60% de los puntos deben caer en el 1/3 central, un 40% en los 2/3 restantes aproximadamente. Si no es as, conviene recalcular de nuevo los lmites de control. Cada vez que un punto salga de los lmites de control, y se detecte y corrija la causa, deberan recalcularse los lmites de control. En cualquier caso estos deberan recalcularse cada 5-6 meses. En los nuevos clculos deben suprimirse los datos que estn fuera de lmites de control, siempre y cuando se hayan determinado y eliminado las causas. Cuando los R estn bajo control la variabilidad del proceso est controlada, por lo que el proceso es estable, y puede pasar a analizarse el Grfico c) Aspectos especficos de los grficos 66 .

Un punto fuera de lmites indica generalmente:

El proceso ha sido modificado en ese momento o desde la ltima toma de muestra

Modificacin de la medida por cambio de persona o instrumento de medicin

El punto est mal marcado o los lmites estn mal calculados

Al igual que en los Grficos R, existe sesgo cuando hay 7 o ms puntos seguidos a un mismo lado de la lnea de .

Una tendencia puede significar un desajuste gradual del proceso. Igual que en los grficos R, el reparto de puntos aproximado debe ser 60% 1/3 central, 40% 2/3 restantes. El reclculo de los lmites de control debe hacerse a la vez que el de R, y siguiendo los mismos criterios. La figura 3-a presenta una pauta de tipo cclico.

Esta pauta en el grfico puede ser debida a cambios en el ambiente tales como temperatura; fatiga del operario,

rotacin de trabajadores y/o fluctuaciones mquinas, en el

voltaje o en la presin. etc. Los grficos A tambin suelen indicar pautas originadas por los programas de mantenimiento, la fatiga del operario. 67

La figura 3-b indica una mezcla de dos o ms colectivos. En este caso, los puntos tienden a caer fuera o ligeramente fuera de los limites de control. A veces, esta pauta aparece por sobrecontrol cuando los operadores ajustan frecuentemente el proceso respondiendo a variaciones aleatorias ms que a la aparicin de causas sistemticas. La figura 3-c indica un cambio en el nivel del proceso. Estos cambios pueden producirse tras la introduccin de nuevos operarios, o tras cambios en las mquinas, materias primas o en la motivacin de los operadores. A veces, se nota incluso mejora tras la simple introduccin del programa de implantacin del C.E.P. por la motivacin ejercida sobre los operadores.

La figura 3-d indica una tendencia, que es un movimiento continuo en una sola direccin. Las tendencias son debidas usualmente al deterioro gradual de las herramientas u otros componentes crticos del proceso. Tambin pueden originarse las tendencias por la fatiga del operario o la presencia de supervisores o por Fig 3-d

influencias como la

estacionales temperatura.

Cuando las tendencias son debidas sistemticas fig 3-e stas a de causas deterioro, ser

pueden

incorporadas a los grficos. La figura 3-e que un indica se

estratificacin traduce en

excesivo

68

agrupamiento

de

puntos

cerca de la lnea central. .Esta situacin puede originarse por haber calculado mal los lmites de control. Finalmente, indicamos que las pautas deben considerarse observando a la vez los grficos, R. Si la distribucin original es normal, los grficos, R evolucionarn de forma independiente. Cualquier correlacin entre ambos grficos sealar que la distribucin no es normal sino sesgada. Eficacia de los grficos ,R

La eficacia de estos grficos se describe a travs de las curvas ARL (Longitud de racha media) y curva caracterstica. A) calculo de las curvas caractersticas y ARL del grfico Curva caracterstica

Suponemos la desviacin tpica conocida y constante. Si la meda cambia desde el valor objetivo mo hasta otro m1 = mo + K. s ,la probabilidad de no detectar el cambio en la primera muestra que se tome ser:

con :

por lo cual :

69

Normalmente se elige a = 0,0027 (Error tipo I) Z

a/2

= 3. Esta curva

(Probabilidad de que el siguiente punto caiga dentro de los lmites de control en funcin del Descentrado del proceso) viene representada (con a = 0,0027), para distintos tamaos de muestra (n) en la figura C.

Curva ARL La probabilidad de no detectar el cambio en la 1 muestra es 1- b. La de no detectarlo en la 2 es b (1- b). La probabilidad de no detectarlo en la muestra K ser: bk-1 (1- b). Esta es una distribucin geomtrica de media 1/(1- b).

70

Conocida la curva caracterstica, la construccin de la ARL es inmediata ya que:

B) Clculo de las curvas caractersticas y ARL del grfico R Curva caracterstica. Hay que utilizar la distribucin del rango relativo. La probabilidad de que una muestra caiga dentro de los lmites de control ser:

para un a determinado (error tipo 1) y dando valores a a (variacin en la dispersin del proceso) obtenemos tos valores de b.

71

La curva ARL la obtenemos mediante la frmula 1/(1- b)

72

Grficos de control (

, S)

Cuando crece el tamao de muestra (n = 10 a12) el mtodo del rango para estimar s pierde eficiencia. En este caso es mejor reemplazar los grficos ( R) por los ( S. Aunque, ,

, S) y calcular para cada subgrupo la media y la desviacin tpica

es un estimador centrado de s2 S no lo es respecto de s, ya que realmente estima C4s ya que E(s) = C4s ; C4 es una constante que depende del tamao de muestra. Por otra parte la desviacin tpica de S es

73

Con esta informacin ya podemos establecer los lmites de control con criterio 3s:

Y poniendo:

Tendremos :

Los parmetros B5, B6 estn en la tabla IV Si no se conoce s, lo estimaremos de los datos pasados. A partir de (m) subgrupos obtenemos:

Siendo

un estimador centrado de s.

Los lmites de control, resultarn:

Y poniendo:

Tendremos:

En cuanto al grfico

, cuando utilizamos como estimador de s a

, los

lmites de control 3s resultarn:

Y poniendo:

74

tendremos :

Las constantes A3, B3 y B4 figuran en la tabla IV Grficos de control de sumas acumuladas (CUSUM) Los grficos de control que hemos visto hasta ahora se conocen como grficos de Shewhart. Un punto dbil de los grficos de Shewhart es que solo se utiliza la informacin contenida en la ltima muestra representada e ignora la informacin dada por el conjunto de muestras. Es cierto que la incorporacin de lmites de atencin y el estudio de pautas trata de mejorar la sensibilidad del grfico Shewhart utilizando ms el conjunto de la informacin pero a costa de complicar algo el grfico reduciendo la sencillez de la Interpretacin El grfico de sumas acumuladas (CUSUM) se presenta como una alternativa al grafico de Shewhart. Incorpora directamente toda la informacin representando las sumas acumuladas de las desviaciones de los valores muestrales respecto de un valor objetivo. Por ejemplo, supongamos que se toman muestras de tamao igual o mayor que 1, siendo la media muestral de la muestra i.

Si suponemos que mo es el objetivo para la media del proceso, el grfico de sumas acumuladas se formar representando la cantidad respecto al nmero de orden (m) de la muestra. Por combinar la informacin de varias muestras, los grficos de sumas acumuladas son ms efectivos que los grficos de Shewhart para detectar pequeos cambios. Son particularmente eficaces cuando el tamao de muestra es n = 1 y, por consiguiente, adecuados para su utilizacin cuando la tecnologa permite inspeccionar y medir cada unidad producida usando a la vez un microordenador en el puesto de trabajo. Si el proceso se mantiene bajo control en el objetivo mo , la suma acumulable variar aleatoriamente respecto del valor cero. Sin embargo, si la media asciende a m1 > mo se apreciar una tendencia ascendente en la 75

suma acumulada Sm. Por el contrario, si la media se desplaza a m2 < mo se apreciara una tendencia decreciente en Sm. Por consiguiente, una tendencia determinada (positiva o negativa) se considerar como una evidencia de que la media del proceso se ha desplazado debido a la presencia de alguna causa asignable que hay que investigar y eliminar. Existen dos criterios para establecer formalmente que el proceso est fuera de control. Uno de ellos es un procedimiento grfico: La mscara V propuesta por Barnhard en 1959 y otro es un procedimiento numrico muy adecuado para establecer en conjuncin con un microordenador. Aqu veremos este segundo procedimiento. En cada toma de muestra hay que calcular los 2 valores siguientes :

donde: es mo la es media el muestral valor en la toma i-sima. centrada)

objetivo

(media

F es un parmetro de la carta de control que normalmente vale Do/2 siendo Do el cambio que queremos detectar con prontitud. , siendo normalmente f = 0,5 ya que queremos detectar normalmente cambios del orden de (n es el tamao muestral).Como

veremos ms adelante, F se puede seleccionar tambin en algn juego de cartas ARL.

Cuando algn valor Si Ti cumple que Si > H Ti < -H (H elegido de acuerdo a la curva ARL que nos interese siendo h normalmente 5) el proceso se

considera fuera de control. Si Si se hace negativo o se pone a 0, de igual forma si Ti se hace positivo o se pone a 0. Una vez corregido el proceso los contadores Si y Ti se pondran a 0.

76

Las curvas ARL de los grficos CUSUM, se calculan a partir de los parmetros del grafico, h y f (y del tamao de la muestra, que est implcito en el desplazamiento) utilizando cadenas de Markov. En la tabla 2.3 se dan valores de h y f ms comunes en funcin del desplazamiento de la media a detectar y sus curvas ARL. Ejemplo CUSUM Consideremos el peso de cartuchos de certa fabricacin sigue siendo una distribucin Normal (ver ejemplo anterior) de media 1,3917 y desviacin tpica 0,005. Valores que resultaban cuando el proceso estaba bajo control.

Si utilizamos las muestras de tamao 5 del ejemplo anterior y queremos detectar desplazamientos de la meda del orden de elegimos h = 5 y f = 0,5 con lo que obtenemos F = 0,5 x 0,0022 = 0,0011 ; H = 5 x 0,0022 = 0,01 ,

En el sexto subgrupo Ti <-0,01 por lo tanto es un punto fuera de control y deberamos corregir el proceso.

Para controlar la variabilidad dentro de las muestras se pueden utilizar los 77

grficos de Shewart del recorrido o de la desviacin tpica, en conjuncin con el CUSUM de medias. No obstante tambin es posible disear una carta de control CUSUM especficamente por los grficos de recorridos o de desviaciones tpicas. La forma de realizarlos es muy similar al CUSUM de medias. Los parmetros h y f con sus curvas ARL del CUSUM para recorridos o desviaciones tpicas estn recogidos en la norma britnica BS 5703.

TABLA

2.3

Valores de h y f recomendados para detectar un desplazamiento de la media de magnitud (*)

78

79

Otros grficos de control.- Grfico de control de media mvil Los grficos de control de media mvil son tambin muy efectivos para detectar pequeos cambios en el proceso, Como los CUSUM, estos grficos son muy adecuados para implantar en procesos automatizados. Supongamos que se han tomado muestras de tamao n y que indiquen las correspondientes medias muestrales. La media mvil de amplitud W en el momento t se define como

Es decir, en cada momento t se elimina la muestra vieja y se sustituye por la ms reciente.

80

La varianza de Mt, es :

Y los lmites de control con criterio 3s sern:

El procedimiento de control consistir en calcular con cada nuevo valor de la nueva Mt y llevarla al grfico con lmites de control dados por (II) concluyendo que el proceso est fuera de control si se exceden los puntos del grfico. En general, la magnitud del cambio a detectar y la amplitud de W estn inversamente relacionados: La deteccin de un cambio pequeo se garantiza mejor con una muestra de tamao elevado. El uso simultaneo de y Mt puede dar buenos resultados. En este caso, , Mt , o ambos caigan fuera de

habr situacin de fuera de control cuando

los lmites de control respectivos. La media mvil es tambin muy adecuada para usar cuando el tamao de muestra es n = 1. Grficos de Control Multidimensional Existen muchas situaciones en las que es necesario el control simultneo de dos o ms caractersticas de calidad. Por ejemplo supongamos una pieza con un dimetro interior y otro exterior que juntos determinen la conformidad de la pieza. Podramos aplicar los grficos de control habituales a las caractersticas y considerar que el proceso est bajo control solamente cuando ambas medias estuvieran dentro de los respectivos lmites de control, esto es equivalente a que el punto caiga dentro del rea rayada en la figura.

Controlar ambas caractersticas independientemente puede ser engaoso. La probabilidad de que 81 excedan sus lmites de control 3s es 0,0027, sin

embargo la probabilidad de que ambas variables excedan los limites cuando el proceso est bajo control es (0,0027)x(0,0027) = 0,00000729 que es muy inferior a 0,0027. Es decir, el error de tipo I es muy diferente de los de los grficos individuales. Esta distorsin se incrementa cuando aumenta el nmero de variables. Si existen P caractersticas independientes y se elabora un grfico X para cada una con error de tipo I = a, el error de tipo I conjunto es s = 1- (1- a)p y la probabilidad de que las P medias caigan dentro de sus respectivos lmites (1a)p. El problema se complica ms todava si existe correlacin entre las diferentes caractersticas (caso frecuente). Problemas como estos constituyen el llamado control de calidad multidimensional y fueron estudiados inicialmente por Hotelling . Supongamos que existen dos caracterstica cualitativas X1 y X2 que se distribuyen de acuerdo con una distribucin normal bivariada siendo X1 y X2 sus valores nominales, S12 y S22 sus varianzas y S12 su covarianza (la covarianza mide el grado de dependencia entre X1 y X2). Si calculada para un subgrupo de tamao n, el estadstico : es la media muestral

se distribuye segn una distribucin T2 de Hotelling con 2 y (n-1) grados de libertad. Si T2a/2,
n-1

al menos de una de las dos caractersticas est fuera de control. es el percentil de la distribucin de Hotelling que deja una cola a la

derecha de valor a. Representando en secuencia los valores resultantes de la ecuacin anterior para cada muestra, como si se tratase de un grfico de control, podemos investigar pautas y otras tendencias no aleatorias del grfico.

82

La mayora de los paquetes de software de control de Calidad permiten analizar con facilidad estos grficos multidimensionales referidos a dos ms variables. TABLAS PARA LA ELABORACIN DE GRFICOS TABLA 1.- DISTRIBUCION NORMAL Probabilidades acumulativas de la distribucin de probabilidad normal (reas bajo la curva desde - infinito hasta z)

TABLAS II y III.- DISTRIBUCION RANGO RELATIVO 83

Puntos de porcentaje de la distribucin de la amplitud relativa w = R/ , universo normal *

*Probabilidades tomadas de E. S. Parson, The Probabilily Integral of the Range in Samples of n Observation from, a Normal Population, Biometrika, Vol. XXXII(1941-42), pgs 301-8. La media y la s tomadas de E. S. Pearson The Percentage Limits for the Distributons of Range in Samples from, a Normal Population, Biometrika, Vol, XXIV (1932), pg. 404-17. Obsrvese que en contraste con la tabla C estas probabilidades estn acumuladas desde el extremo inferior de la distribucin.

84

n = Tamao de la muestra TABLA IV - GRAFICOS POR VARIABLES FACTORES PARA CONSTRUIR LIMITES DE CONTROL

85

ESTUDIO INICIAL - RESUMEN DE FORMULAS

CONTROL RESPECTO A ESTANDAR - RESUMEN DE FORMULAS

86

CAPTULO 8.- CAPACIDAD DEL PROCESO Introduccin Un proceso de fabricacin es un conjunto de equipos, materiales, personas y mtodos de trabajo que genera un producto fabricado.

Para analizar el comportamiento del proceso, se toman muestras de producto fabricado y se realizan ensayos para determinar el valor de una caracterstica de calidad seleccionada previamente. Desde el punto de vista del control estadstico, es conveniente incluir la etapa de muestreo y ensayo dentro del proceso mismo. Conceptualmente debemos

considerar que cualquier variacin en las condiciones de un proceso (Modificacin en el equipo, cambio de materias primas, etc.) da lugar a otro proceso, diferente del anterior. El primer paso para aplicar una tcnica estadstica es definir la caracterstica de calidad que se va a medir en el producto fabricado. Desde el punto de vista estadstico, esta caracterstica de calidad constituye una variable aleatoria, porque an despus de realizar una serie de mediciones, el valor que se obtendra en la siguiente medicin no puede predecirse por clculo. El conjunto de todos los resultados de mediciones que pueden obtenerse es nuestro universo o poblacin. Cualquier subconjunto de mediciones extrado del universo constituye una muestra. Con respecto al concepto de universo o poblacin, cuando se aplica a resultados de mediciones en un proceso, es necesario puntualizar lo siguiente: La poblacin o universo de resultados es el conjunto de datos que se obtuvieron hasta ese momento mas aquellos que se 87

obtendran si el proceso continuara funcionando siempre bajo las mismas condiciones. Esto se conoce como Universo Hipottico de mediciones de la caracterstica de calidad. Antes de aplicar cualquier tcnica estadstica, es necesario establecer algunas hiptesis bajo las cuales se va a desarrollar el anlisis. En primer lugar, vamos a suponer que la caracterstica de calidad (Variable aleatoria) es continua y de distribucin normal. En segundo lugar, consideraremos que el proceso est bajo control estadstico, es decir que la variabilidad se debe solamente a un sistema constante de causas aleatorias (No intervienen causas asignables). Al realizar una sucesin de mediciones de la caracterstica de calidad sobre muestras del producto fabricado, encontramos que los valores fluctan alrededor de un valor central. Esto es lo que llamamos la fluctuacin natural y esperable del proceso. Esta variacin de la caracterstica de calidad medida se debe a un conjunto muy grande de causas que afectan el proceso, cuyo efecto individual es pequeo y que actan en forma aleatoria (Sistema constante de causas aleatorias). La fluctuacin natural del proceso es inherente al mismo y no puede eliminarse, slo puede reducirse realizando modificaciones al proceso mismo, lo cual significa, como ya hemos dicho, trabajar con otro proceso. La fluctuacin natural de un proceso puede cuantificarse a travs de la desviacin standard del mismo, con la cual podemos calcular Lmites de Tolerancia Natural del proceso. Se debe insistir en que estos lmites no pueden fijarse voluntariamente, dependen del proceso y de las variables no controlables del mismo. Generalmente se toma un rango para la fluctuacin natural de 6 sigmas. Los Lmites de Especificacin de un producto son fijados voluntariamente por el cliente, por el fabricante o por alguna norma. Estos lmites constituyen un requisito a cumplir por el producto y no deben confundirse en ningn caso con los Lmites de Control o con los Lmites de Tolerancia Natural del proceso. La Capacidad de un proceso es la aptitud para generar un producto que cumpla con determinadas especificaciones. En el mejor de los casos, es conveniente que los Lmites de Tolerancia Natural del proceso se encuentren dentro de los Lmites de Especificacin del producto. De esta manera nos aseguramos que toda la produccin cumplir con las especificaciones. 88

Para analizar la capacidad del proceso se puede utilizar un histograma de frecuencias. Si se dispusiera de todos los datos del universo para la caracterstica de calidad medida y se hiciera un histograma este permitira tener una idea exacta de la fluctuacin natural del proceso. Como esto es imposible, es necesario tomar un cierto nmero de mediciones (Mnimo 100200) y efectuar con ellas un histograma de frecuencias.

Este es el histograma de una muestra y por lo tanto es slo una estimacin del verdadero histograma del universo. Si representamos en las abscisas los Lmites de Especificacin del producto, podemos ver grficamente si el proceso tiene aptitud (Capacidad) para fabricar dicho producto.

Anlisis de la capacidad del proceso

89

Las tcnicas estadsticas son tiles a lo largo de todo el ciclo productivo incluyendo: Actividades previas a la fabricacin, cuantificacin de la variabilidad del proceso, comparacin de la variabilidad con las especificaciones y la reduccin de la variabilidad. Al conjunto de estas actividades se le denomina anlisis en la capacidad del proceso. Definiremos el anlisis de capacidad, como el estudio de ingeniera encaminado a estimar la capacidad del proceso. La capacidad del proceso puede estimarse definiendo la forma de la distribucin que sigue la variable en estudio y dando una medida del valor central (media) y de la dispersin (sigma). La capacidad del proceso se refiere a su uniformidad, la variabilidad es una medida de la uniformidad. Existen dos formas de variabilidad, la variabilidad inherente, existente en un momento dado, tambin llamada variabilidad instantnea y la variabilidad a lo largo del tiempo. Como medida de la capacidad de un proceso es costumbre tomar un intervalo de 6s u 8s en la distribucin de la caracterstica en estudio. La figura adjunta muestra un proceso para el que la distribucin es Normal con media m y desviacin tpica s. Los lmites naturales de tolerancia inferior y superior del proceso caen en el intervalo m - 3.s -:- m + 3.s . Para la distribucin Normal los lmites de tolerancia incluyen el 99,75% de los valores de la variable. Dicho de otra forma, slo el 0,27% de los valores caen fuera de los lmites naturales de tolerancia. Si la distribucin no es Normal, el porcentaje de valores fuera de los lmites m 3s puede desviarse sensiblemente del 0,27% citado. 90

Se pueden utilizar como medida de la capacidad otros criterios como por ejemplo que el 98% de la produccin entre en el intervalo de Tolerancia. En este caso utilizando las tablas de la Distribucin Normal (Tabla I) vemos que deben entrar como mnimo 2x2,33s = 4,66 s. El anlisis de capacidad del proceso es fundamental en un Programa Integral de Mejora de Calidad. Entre sus aplicaciones, podemos sealar : 1. Predecir como se comportar el proceso respecto de las especificaciones. 2. Ayudar en la seleccin o modificacin de los parmetros del proceso. 3. Orientar en el establecimiento de la frecuencia de los desmuestres para el control del proceso. 4. Especificar las tolerancias de nuevos equipos 5. Reducir la variabilidad en el proceso de fabricacin. Dos son, principalmente, las tcnicas utilizadas en el anlisis de la capacidad de un proceso: Histogramas y Grficos de Control. Anlisis de la capacidad del proceso usando histogramas La distribucin de frecuencias suele ser til para estimar la capacidad del proceso. Se requieren, por lo menos, entre 50/100 observaciones para realizar la estimacin. Siempre que sea posible y antes de comenzar la recogida de datos, deben seguirse los siguientes pasos: a) Escoger adecuadamente la mquina o mquinas sobre las que va a realizarse el estudio de forma que sean representativas del conjunto de mquinas al que van a extenderse las conclusiones. b) Seleccionar las condiciones operativas del proceso definiendo cuidadosamente estas condiciones ya que su variacin puede afectar a la capacidad del proceso. c) Seleccionar, cuando proceda, un operador representativo. d) Seguir estrechamente el proceso de toma de datos y registrar el orden en que se producen.

91

El histograma, con su valor medio capacidad del proceso que es

y su desviacin tpica S estima la

3S. Una ventaja del histograma es que nos

da una impresin inmediata de como es la caracterstica en estudio. Para cuantificar la Capacidad de Proceso se utilizan coeficientes que permiten comparar el rango de especificaciones con la fluctuacin natural del proceso. Uno de ellos es Cp:

donde LSE y LIE son, respectivamente, el Lmite Superior y el lmite inferior de Especificacin Si el proceso tiene capacidad para fabricar el producto, entonces C p > 1. En general se exige Cp > 1.30 para mayor seguridad.

Cp tiene el inconveniente de que para poder aplicarlo, el centro de gravedad del rango de especificaciones debe coincidir con la tendencia central de las mediciones del proceso. Cuando esto no ocurre se emplea el Cpk:

Donde:

92

En el grfico podemos observar que una buena parte del producto est por encima del Lmite Superior de Especificacin (LSE). An as resulta Cp > 1, indicando errneamente que el proceso tiene capacidad suficiente. En este caso se debe usar el segundo coeficiente que muestra claramente que el proceso no tiene capacidad suficiente (Cpk < 1), tal como se puede observar en el grfico.

Un proceso suele decirse que es apto cuando Cp > 1 incluso Cp > 1,3 Modernamente, ha comenzado a utilizarse:

donde

siendo

El uso de un histograma para analizar la capacidad de un proceso tiene la ventaja de que se puede apreciar la forma de la distribucin, con lo cual se puede confirmar o rechazar la hiptesis de que la misma es normal. Pero el problema es que no se puede detectar la presencia de patrones no aleatorios, con lo cual no es posible confirmar o rechazar la hiptesis de que el proceso est bajo control estadstico. Si el proceso no est bajo control estadstico los 93

resultados del anlisis de la capacidad de proceso no sern vlidos y pueden llevar a conclusiones equivocadas. Anlisis de la capacidad del proceso usando grficos de control Los histogramas y otros mtodos de anlisis tales como los grficos de probabilidad indican como vara el proceso pero no muestran, necesariamente, la capacidad potencial del proceso ya que ste puede estar en situacin de fuera de control o presentar pautas que si se eliminaran reduciran la variabilidad de la caracterstica en estudio. Los grficos de control son muy tiles en este sentido y deben ser considerados la tcnica principal en los anlisis de capacidad. En los anlisis de capacidad pueden usarse los grficos de control por variables y los grficos de control por atributos aunque son preferibles los primeros por la mayor informacin que suministran. Los grficos , R permiten estimar la variabilidad instantnea (capacidad del

proceso a corto plazo) y la variabilidad a lo largo del tiempo(capacidad del proceso a largo plazo). La variabilidad instantanea viene dada por s = R/d2 , donde d2 es un valor tabulado en funcin del tamao de muestra n. No debe estimarse la capacidad del proceso a corto plazo cuando se presenta una situacin fuera de control ya que previamente habra que encontrar las causas asignables y poner el proceso bajo control. Cuando se utilizan grficos -R, en el grfico de se representan los

promedios de subgrupos, es decir, promedios muestrales. No debe confundirse la desviacin standard del proceso con la desviacin standard de los promedios muestrales. Si la desviacin standard del proceso es s y cada subgrupo tiene m mediciones, la desviacin standard entre subgrupos es:

Si se utiliza por error la desviacin estndar entre subgrupos para calcular los coeficientes de capacidad del proceso, se obtendrn valores ms altos que los que corresponden a la verdadera capacidad del proceso.

94

CAPTULO 9.- GRAFICOS DE CONTROL POR ATRIBUTOS Introduccin Algunas caractersticas de calidad no pueden ser representadas

convenientemente por medio de variables cuantitativas. En estos casos, las unidades de producto se clasifican en conformes o en no conformes segn la caracterstica o caractersticas cualitativas sean o no conformes con las especificaciones. Las caractersticas de calidad de este tipo se denominan atributos. Los datos de tipo atributo tienen solamente dos valores: Conforme / no conforme, pasa/no pasa, funciona / no funciona, presente / ausente. Tambin se consideran atributos aquellas caractersticas cuantitativas que se registran en trminos de sino como por ejemplo, el dimetro de un eje cuya conformidad solo la medimos en trminos de aceptable/no aceptable, las imperfecciones de pintura en una puerta de un automvil, las burbujas en la laca de un detonador, la presencia/ausencia de un percutor, etc. Vamos a analizar cuatro tipos de grficos de control por atributos: 1. Grfico p para porcentajes defectuosos 2. Grfico np para el nmero de unidades defectuosas 3. Grfico c para el nmero de defectos 4. Grfico u para el nmero de defectos por unidad inspeccionada Grfico p para porcentajes defectuosos La fraccin no conforme de un colectivo se define como el cociente entre el nmero de unidades defectuosas y el nmero total de unidades en dicho colectivo. Cada unidad de producto puede ser examinada por el inspector respecto de una o varias caractersticas cualitativas. Si la unidad inspeccionada no es conforme respecto a la especificacin en una o ms caractersticas, se clasifica como no conforme. Habitualmente, la fraccin no conforme se expresa en forma decimal aunque puede tambin indicarse en tanto por ciento. La distribucin binomial es la base estadstica del grfico de control por atributos. Supondremos que el proceso est operando de forma estable y que la posibilidad de que una unidad de producto sea defectuosa es constante y de valor p. Tambin, supondremos que las unidades producidas sucesivamente son independientes. Entonces, si tomamos una muestra de n unidades, y 95

llamamos x al nmero de unidades no conformes, la probabilidad de que x tome los valores 0, 1, 2.... n vendr determinada por la distribucin binomial con parmetros n, p:

El valor medio y la varianza de esta distribucin son :

La fraccin muestral no conforme se define como el cociente entre el nmero de unidades no conformes en la muestra x y el tamao de la misma p = x/n. El valor medio y la varianza de p sern respectivamente :

como consecuencia de la relacin p = x/n Operativa del grfico de control p La base estadstica para definir los lmites de control es comn con los restantes grficos de Shewhart: Si W es un estadstico que describe una determinada caracterstica de calidad siendo mw y sw2 su media y su varianza, los lmites de control se definen como :

K es la distancia de los lmites de control a la lnea central expresada como un mltiplo de sw. Habitualmente escogeremos K = 3. Supongamos que conocemos o se especifica la fraccin p no conforme de un proceso de produccin. Entonces los limites de control resultan:

La operativa consiste en tomar sucesivas muestras de n unidades, contar dentro de cada muestra el nmero de unidades no conformes y calcular D/n llevando este valor al grfico. En tanto =

permanezca dentro de los lmites

de control y la secuencia de puntos no seale ninguna pauta distinta a la que puede surgir por mero azar, diremos que el proceso est bajo control al nivel p 96

de fraccin no conforme. Si por el contrario, observamos algn punto fuera de control o un patrn inusual diremos que la fraccin defectuosa ha cambiado a un nivel diferente y que el proceso est fuera de control. Cuando se desconoce p, debe estimarse a partir de los datos. El procedimiento a seguir es seleccionar m muestras preliminares, cada una de tamao n. Como norma general, m estar comprendido entre 20 y 25. Si D i es el nmero de unidades defectuosas en la muestra i, calcularemos la fraccin defectuosa en la muestra como ; i = 1, 2... .n y la media de estas fracciones,

, estimar la media p del proceso siendo los lmites de control:

Frecuentemente se utiliza solo el lmite superior. Estos lmites de control se consideran como limites de prueba y sirven para determinar si el proceso estaba bajo control cuando las m muestras iniciales fueron seleccionadas. Si todos los puntos caen dentro de los lmites de control y no se observa ninguna pauta anormal dictaminaremos que el proceso estaba bajo control a la toma de las m muestras y los lmites de prueba sern validos para controlar la produccin actual y la futura. Los lmites de control para la produccin actual deben basarse en datos obtenidos de una situacin estable. Por ello, cuando alguno de los puntos iniciales est fuera de control se hace necesario revisar los lmites de control. Esto se realiza examinando cada punto fuera de control y buscando las causas asignables. Si se localiza la causa asignable se descarta el punto correspondiente y se vuelven a calcular los lmites de control con los puntos restantes. Puede darse el caso que alguno de estos restantes puntos se encuentre ahora fuera de control respecto de los nuevos lmites ya que estos sern, normalmente, ms estrechos que los iniciales. Entonces, deben repetirse los pasos dados anteriormente hasta que todos los puntos se encuentren dentro de control con lo que ya podremos adoptar los lmites hasta entonces provisionales como lmites definitivos. Si el grfico de control se basa en un valor estndar conocido (un objetivo) para la fraccin no conforme p, entonces el clculo de lmites de prueba es, 97

generalmente, innecesario aunque deben tomarse ciertas precauciones en el sentido de comprobar si el proceso est bajo control a un valor de p diferente dei indicado en el objetivo. Por ejemplo, supongamos que la Direccin seala como valor objetivo p = 0,01 pero que el proceso se encuentra realmente bajo control a p = 0,05. Utilizando el grfico correspondiente a p = 0,01 encontraremos muchos puntos fuera de control sin que aparezca causa asignable. No obstante, suele ser til esta opcin para mejorar el nivel de calidad llevando el proceso al nivel adecuado, sobre todo en procesos donde la fraccin no conforme puede ser controlada mediante un proceso sencillo de ajuste. Diseo del grfico p El grfico p tiene tres parmetros a especificar: Tamao y frecuencia del desmuestre y distancia entre lmites de control. Es frecuente calcular el grfico de control a partir de la inspeccin realizada a lo largo de un periodo de tiempo determinado. Un da, un turno, etc. En este caso, la frecuencia y el tamao de la muestra estn relacionados. Generalmente, se selecciona inicialmente la frecuencia del desmuestre apropiada para la produccin a inspeccionar y de ah resulta el tamao de la muestra, Los subgrupos racionales pueden jugar tambin un papel importante en determinar la frecuencia del desmuestre. Por ejemplo, si hay tres turnos y sospechamos que entre turnos puede variar el nivel de calidad utilizaremos cada turno como un subgrupo sin mezclarlos para obtener una fraccin diaria no conforme. Si p es pequeo n deber ser suficientemente grande para encontrar, al menos una unidad defectuosa en la muestra. Se ha sugerido que el tamao de muestra debe ser lo bastante grande para tener una probabilidad de aprox. 50% de detectar un cambio de una determinada magnitud. Por ejemplo, supongamos que p = 0,01 y que queremos que la probabilidad de detectar un cambio a p = 0,05 sea del 50%. Suponiendo que aproximamos la distribucin binomial respecto de la normal, escogeremos de tal forma que el lmite de Control Superior coincide con la fraccin no conforme en la situacin de fuera de control. Si 6 es la magnitud del cambio del proceso, entonces n debe satisfacer 98

En nuestro ejemplo, p = 0,01, d = 0,05-0,01 = 0,04 y con K=3

n = 56

Los lmites 3s son los que se usan con ms frecuencia aunque pueden adaptarse otros ms sensibles a costa de exponerse a situaciones ms frecuentes de falsa alarma. A veces, suelen usarse limites ms estrechos (por ejemplo 2s) dentro de una situacin de urgencia para mejorar la calidad de un proceso. Estos lmites deben utilizarse con precaucin porque las falsas alarmas destruyen la confianza de los operadores en los grficos de control. Hay que tener en cuenta que los lmites de control estudiados se basan en la distribucin binomial que considera constante la proporcin defectuosa p y que los valores sucesivos son independientes. En procesos en los que las unidades no conformes estn agrupadas o en los que la probabilidad de producir una unidad defectuosa depende de que la anterior unidad producida haya sido no defectuosa, no son aplicables este tipo de grficos. Deben examinarse con cuidado aquellos puntos situados por debajo del lmite de control inferior. Estos puntos no suelen ser lo que aparentemente indican: Una mejora en la calidad del proceso por disminucin de a sino que suelen originarse por errores en la inspeccin o por causa de aparatos de medida mal calibrados. Tambin puede deberse a que los operadores hayan registrado datos ficticios para cubrir su responsabilidad. Grfico np para unidades defectuosas Supongamos un proceso que fabrica tornillos. Una manera de ensayar cada tornillo sera probarlo con una rosca calibrada. El resultado de este ensayo slo tiene dos posibles resultados: Defectuoso - No Defectuoso ( Conforme-No Conforme ) . Si el tornillo no entra en la rosca, se lo considera defectuoso o no conforme.

99

Para controlar este proceso, se puede tomar una muestra de tornillos y contar el nmero de defectuosos presentes en la muestra.

La variable aleatoria nmero de defectuosos es una variable aleatoria discreta, porque puede tomar un nmero finito de valores, o infinito numerable. Los grficos np se utilizan para controlar el nmero de defectuosos en una muestra. Para controlar este proceso, un inspector se coloca al final de la lnea de produccin y cada hora retira una muestra de n=50 tornillos (por ejemplo), comprueba cada uno con la rosca y anota el nmero de defectuosos.

Este resultado se anota en un grfico hora por hora denominado grfico np. Si se tomara del proceso un slo tornillo Cul es la probabilidad de que sea defectuoso? Imaginando la poblacin de tornillos que podra fabricar el proceso trabajando siempre en las mismas condiciones, una cierta proporcin p de estos seran defectuosos. Entonces, la probabilidad de tomar un tornillo y que sea defectuoso es p. En una muestra de n tornillos, la probabilidad de encontrar: 0 defectuosos ; 1 defectuoso ; 2 defectuosos ; ... ; n defectuosos est dada por una distribucin binomial con parmetros n y p. Como sabemos, el promedio de la poblacin es p y la varianza es n.p.(1-p). Para construir los grficos de control np, en una primera etapa se toman N muestras (ms de 20 25) a intervalos regulares, cada una con n tornillos. Se cuenta en cada muestra el Nmero de Defectuosos y se registra. Se obtendra una Tabla como la siguiente:

100

En cada muestra, la fraccin de defectuosos es Di/n, siendo Di el nmero de elementos defectuosos en la muestra i, y n el nmero de elementos en la muestra i A partir de la tabla podemos calcular p como promedio de las fracciones de defectuosos en las muestras:

siendo N el nmero de muestras, y luego la Desviacin Standard s:

Con esto podemos calcular los Lmites de Control para el grfico np:

Construimos entonces un Grfico np de prueba y representamos el nmero de defectuosos en las muestras. Si no hay puntos fuera de los lmites de control y no se encuentran patrones no aleatorios, se adoptan los lmites calculados para controlar la produccin futura. Para las personas con poco entrenamiento estadstico, este grfico suele ser ms fcil de interpretar que el grfico p. Frecuentemente se utiliza solo el lmite superior. En algunos procesos interesa medir la cantidad de defectos que presentan las unidades de producto que se estn fabricando. Por ejemplo, se fabrican 101

telfonos celulares y entonces se toma uno de ellos y se cuenta el nmero total de defectos. Estos podran ser:

Rayas en la superficie.

grietas en el plstico

Antena defectuosa

Botn defectuoso.

Etc.

Los defectos pueden ser de diferentes tipos y se cuenta el total de todos estos defectos en la unidad inspeccionada. Obtenemos un resultado que es el Nmero de Defectos por unidad de inspeccin. A medida que el proceso genera las unidades (Telfonos mviles), retiramos una unidad a intervalos regulares y contamos el nmero total de defectos. En cada unidad podemos encontrar:? 0 defectos

1 defecto

2 defectos

...

n defectos

Los resultados obtenidos al contar el Nmero de Defectos en unidades de inspeccin tomadas a intervalos regulares constituyen una variable aleatoria discreta, porque puede tomar los valores discretos 0, 1, 2, ... n. Esta variable aleatoria tiene una distribucin de Poisson: 102

Los grficos C se utilizan para controlar el nmero de defectos en una muestra del producto o unidad de inspeccin. Para controlar este proceso, un inspector se coloca al final de la lnea de produccin y cada cierto intervalo retira una unidad de inspeccin , verifica y anota el nmero total de defectos. Este resultado se anota en un grfico denominado grfico C. De acuerdo a la Distribucin de Poisson, si denominamos C al parmetro de la funcin de distribucin, el promedio de la poblacin es C y la varianza tambin es C. Una unidad defectuosa puede tener uno o ms defectos. Sin embargo, es posible que una unidad de producto tenga varios defectos y que no sea clasificada como defectuosa debido a la naturaleza poco importante del defecto. Existen en la prctica muchas situaciones en las que es preferible trabajar con el nmero de defectos que con el porcentaje o el nmero de unidades defectuosas. Por ejemplo, el nmero de soldaduras defectuosas en un tubo de conduccin de gas, el nmero de defectos funcionales es un dispositivo electrnico, etc. Se pueden efectuar grficos de control para el nmero total de defectos por unidad de producto o para el nmero de defectos en la muestra. Estos grficos de control se basan en la distribucin de Posson que exige un nmero de puntos donde potencialmente podra producirse el defecto infinitamente grande, as como que la probabilidad de que el defecto aparezca en un determinado punto sea muy pequea y constante. La unidad de inspeccin debe ser la misma en cada muestra. Es decir cada unidad de inspeccin debe representar siempre una probabilidad igual de que se produzcan los defectos. En la mayor parte de las situaciones prcticas, estas condiciones no se satisfacen exactamente. El nmero de oportunidades (puntos) para los defectos suele ser finito y la probabilidad de aparicin de defectos puede no ser constante. Si las desviaciones respecto de la situacin ideal no son importantes, puede usarse el modelo de Poisson. Existen, sin embargo, casos en los que las desviaciones respecto de las condiciones del

103

modelo son considerables y en los que la utilizacin de la distribucin de Poisson es inadecuada. Grficos c para tamao de muestra constante En el grfico c se representan el nmero de defectos existentes en cada unidad de inspeccin. En la mayor parte de los casos, la unidad de inspeccin ser una unidad de producto aunque esto no es absolutamente necesario ya que la unidad de inspeccin constituye simplemente una porcin de produccin sobre la que es conveniente registrar el nmero de defectos encontrados. Puede ser un grupo de 1,5 6 10 unidades de producto. Supongamos que los defectos tienen lugar en esta unidad de inspeccin de acuerdo con la distribucin de Poisson

donde x es el nmero de defectos en la unidad de inspeccin y C es el parmetro de la distribucin, Sabemos que la media y la varianza de la distribucin de Poisson son ambas iguales a C. En consecuencia, los lmites de control 3 sigma para el nmero de defectos sern:

Hay que tener en cuenta que la probabilidad de producir una falsa alarma por situarse el punto por encima del lmite de control superior es diferente que la de situarse por debajo del lmite inferior (colas superior e inferior diferentes). Si no se conoce el parmetro c, debe estimarse a partir de una muestra preliminar de unidades de inspeccin. El valor obtenido en la estimacin, O sustituir al valor O en los lmites arriba indicados. Anlisis de defectos Los datos sobre defectos aportan siempre mayor informacin que los relativos a unidades defectuosas ya que habitualmente existen diversos tipos de defectos. Al analizar por conteo la frecuencia de cada tipo de defecto observamos que, en muchas ocasiones, los resultados estn acordes con la distribucin de PARETO y que un pequeo nmero de defectos es causa de la mayor parte de 104

los problemas. Si somos capaces de eliminar las causas de unos pocos tipos de defectos, habremos conseguido una drstica mejora en la calidad. Grfico u Supongamos que se est controlando el nmero de defectos en un proceso de ensamblado de licuadoras y se define una unidad de inspeccin de 5 licuadoras. En este caso es posible trabajar con un grfico C, como ya hemos visto. Pero tal vez se desea controlar el promedio de defectos por cada licuadora (unidad de produccin) en lugar del total de defectos para las 5 licuadoras (unidad de inspeccin):

siendo ni la cantidad de Defectos por Unidad de Inspeccin y m el nmero de Unidades de Produccin en la Unidad de Inspeccin. En nuestro ejemplo, si encontramos ni defectos en la unidad de inspeccin (5 licuadoras), la cantidad promedio de defectos por licuadora ser Se debe tener en cuenta que x es una nueva variable aleatoria discreta que toma valores 0, 1/m, 2/m, etc., y cuya distribucin de probabilidades se puede calcular a partir de la Distribucin de Poisson. Como en el caso de los grficos C, en una primera etapa se toman N unidades de inspeccin (ms de 25 30) a intervalos regulares. Se cuenta en cada unidad de inspeccin el Nmero de Defectos y se registra. Luego se divide el Nmero de Defectos de cada unidad de inspeccin por m (Nmero de unidades de produccin en cada unidad de inspeccin). En nuestro ejemplo (m = 5) la Tabla quedara as:

Entonces, a partir de la tabla podemos calcular el parmetro U, como promedio del Nmero de Defectos por licuadora, y la Desviacin Standard:

105

; siendo : ni la cantidad de Defectos por Unidad de Inspeccin, m el Nmero de Unidades de Produccin en la Unidad de Inspeccin y N el Nmero de Unidades de Inspeccin Con esto podemos calcular los Lmites de Control para el grfico U:

106

DISTRIBUCIN BINOMIAL Probabilidad de r o menos sucesos en n intentos, donde p es la ocurrencia de cada intento.

107

10.- LINEAS GENERALES PARA IMPLANTAR GRAFICOS DE CONTROL Ventajas de los grficos de control Existen importantes razones para implantar los grficos de control. Destacamos las siguientes: a) Los grficos de control son una tcnica de eficacia probada para mejorar la productividad. La adecuada implantacin de un programa de C.E.P. reduce la repeticin de las operaciones no conformes y los rechazos por desechos que son uno de los principales enemigos de la productividad. De esta reduccin se deriva una disminucin en los costes y un incremento de produccin de producto correcto b) Los grficos de control son eficaces en la prevencin de defectos. El objetivo bsico del grfico de control es detectar cualquier cambio en el proceso o en el producto. Siempre es ms barato hacer las cosas bien de entrada que escoger las unidades buenas dentro de un lote de malas y buenas. Si no se posee un control eficaz, se estar pagando por fabricar produccin no conforme. c) Los grficos de control previenen de ajustes innecesarios del proceso. El grfico de control distingue entre el ruido de fondo y una variacin anormal. Si el operador ajusta el proceso basndose en comprobaciones peridicas no relacionadas con la implantacin sistemtica de los grficos de control, a menudo reaccionar frente al ruido de fondo y realizar ajustes innecesarios. d) El grfico de control proporciona informacin sobre la capacidad del Proceso. El grfico suministra informacin sobre los parmetros bsicos del proceso y sobre su estabilidad a lo largo del tiempo. La tecnologa moderna, utilizando ordenadores, hacen sencilla la implantacin de los grficos de control, en cualquier tipo de proceso. Como resumen de lo visto en los captulos anteriores, vamos a tratar sobre los siguientes puntos : A) Determinacin de la caracterstica a controlar y desde donde se va a controlar B) Seleccin del grfico adecuado

108

A) Seleccin de la caracterstica a controlar y donde controlarla a) En el comienzo de la implantacin se aplican los grficos a aquellas caractersticas del proceso o del producto que se consideran importantes. Los grficos nos dirn si son realmente necesarias. b) Eliminar grficos que se encuentren innecesarios. c) Disponer de una informacin actualizada sobre el nmero y tipos de grficos de control existentes en el proceso. Cuando comienza la implantacin, el nmero de grficos suele crecer de forma continuada, despus decrece. Cuando el proceso se estabiliza, el nmero de variables seguidas por grficos, suele mantenerse constante aunque stas no son necesariamente las mismas. d) Segn se va sabiendo ms sobre el proceso, el nmero de grficos por atributos disminuye y el nmero de grficos por variables aumenta. e) Al comienzo, suelen utilizarse bastantes grficos por atributos para el producto final o intermedio. Despus estos grficos tienden a ser sustituidos por grficos por variables para caractersticas de las primeras fases del proceso. f) Los grficos de control son procedimientos a implantar en la lnea tan cerca del puesto de trabajo como sea posible, as, la informacin llegar con rapidez. Adems, las personas responsables de produccin tendrn la responsabilidad directa de recoger datos, realizar los grficos e interpretar resultados. Los operadores e ingenieros que trabajan en el proceso disponen del conocimiento del mismo necesario para corregir fallos y utilizar el grfico como una herramienta para mejorar la calidad. Los ordenadores facilitan enormemente la rapidez de clculos y presentacin de grficos por lo que no pueden faltar en ningn procedimiento moderno de control estadstico del proceso. B) Seleccin del grfico adecuado Grficos , R (o , S); Solo para variables cuantitativas.

Los grficos por variables se utilizan en los casos siguientes:

109

a) Comienza un nuevo proceso, o un nuevo producto va a fabricarse en un proceso existente. b) El proceso tiene continuos problemas o es incapaz de cumplir las tolerancias especificadas. c) La verificacin de la calidad producida requiere ensayos destructivos o costosos procedimientos de ensayo. d) Se desea reducir la inspeccin por desmuestre y otras verificaciones sobre el producto al mnimo e) Se han utilizado, sin resultado, grficos de control por atributos.

f) Procesos con especificaciones muy estrechas. g) Situaciones en las que el operador debe decidir si ajusta o no el proceso. h) Cuando ha de demostrarse ante el cliente de forma continuada, la estabilidad y la capacidad del proceso. Grficos CUSUM Se puede utilizar en todos los casos sealados para el grfico , R, pero donde realmente muestra ms ventajas es: a) Cuando los procesos vayan des corrigindose lentamente (por ejemplo procesos qumicos) b) Cuando sea necesario descubrir rpidamente pequeos desajustes. c) Situaciones en las que es posible disponer un microordenador en la lnea. Grficos por atributos Se recomienda utilizar los grficos por atributos en los siguientes casos: a) Los operadores controlan las causas asignables y es preciso reducir el porcentaje de fallos. b) El proceso es una operacin de montaje compleja y la calidad del producto se mide en trminos de conforme/no conforme. 110

c) Es necesario el control del proceso pero no pueden obtenerse datos cuantitativos. d) Para facilitar a la direccin una visin con un resumen informativo sobre la eficacia del proceso. Grficos de control para valores individuales Se puede usar conjuntamente con los grficos de rango mvil en los siguientes casos: a) Procesos en los que no puede obtenerse ms que una medida por muestra o donde las medidas repetidas solo difieren debido a errores analticos. Esto suele suceder en los procesos qumicos. b) Procesos donde la tecnologa existente cuantifica cada unidad producida. En estos casos, tambin pueden considerarse los grficos de media mvil. c) Cuando la cadencia de aparicin de nuevos datos es muy lenta y sera impracticable esperar a reunir una muestra mayor porque esto supondra una reaccin demasiado tarda ante los problemas.

111