Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Este tipo de modelos matemticos se denominan Determinsticos. Hay fenmenos que necesitan
otro tipo de modelos matemticos, que se denominan no determinsticos, probabilsticos o
estocsticos.
Por ejemplo, supongamos que un agricultor necesita saber cuanta lluvia va a caer en los
prximos meses, antes de decidir si le conviene sembrar o no esta temporada. El agricultor se
inform en la oficina de meteorologa acerca de la presin baromtrica, la temperatura, velocidad
del viento y otros datos meteorolgicos de la zona en que vive.
Sin embargo, no hay una ecuacin que con todos esos datos le permita calcular los milmetros de
lluvia que van a caer en un mes en forma precisa.
De la misma manera, ningn operador puede calcular cuanto va a subir la Bolsa, ni siquiera si va
a subir o bajar, an cuando tenga a su alcance todas las variables econmicas disponibles para el
pas. Este tipo de fenmenos No admiten un modelo determinstico, sino un modelo
probabilstico, que como resultado nos dice la probabilidad de que llueva una cierta cantidad, o
la probabilidad de que la Bolsa suba un cierto porcentaje. El resultado no es un valor
determinado, sino la probabilidad de un valor.
1
Experimento 2:
Se arroja una moneda cuatro veces y se cuenta el nmero total de caras obtenidas:
Experimento 3:
Se arroja una moneda cuatro veces y se anota la sucesin de caras (C) y cecas (X) obtenidas:
Experimento 4:
2
Entonces, el subconjunto formado por un solo elemento del espacio muestral es un suceso.
El conjunto formado por todos los elementos del espacio muestral tambin es un suceso:
nmero pequeo de resultados posibles. En segundo trmino, supondremos que todos los
resultados que integran el espacio muestral (sucesos elementales) tienen la misma probabilidad
de ocurrir.
Con estas dos hiptesis, la frmula para calcular la probabilidad es muy sencilla. Supongamos
que se trata de un experimento cualquiera cuyo espacio muestral S tiene N elementos (N
resultados posibles). Deseamos calcular la probabilidad de un suceso H (Un subconjunto H del
espacio muestral S) que tiene m elementos. De acuerdo a lo dicho previamente, el nmero N
tiene que ser pequeo y la probabilidad de cada suceso elemental tiene que ser la misma:
Veamos algunos ejemplos. Supongamos que se arroja un dado sobre una mesa y apostamos a que
salga un nmero igual o menor que 4. Sabemos que son igualmente posibles los nmeros: {1, 2,
3, 4, 5 y 6} (Espacio muestral con 6 elementos).
Pero los nmeros favorables a nuestra apuesta son: {1, 2, 3 y 4} (Suceso con 4 elementos).
Entonces, la probabilidad de que ganemos es:
Es decir que tenemos a nuestro favor una probabilidad de 0,666.. (o sea aproximadamente del 67
%). Si apostamos a un slo nmero, por ejemplo a que sale un as, la probabilidad de ganar sera:
Repitiendo, la probabilidad es un nmero entre 0 y 1, que nos dice en que medida es posible que
ocurra un suceso.
2.- Conceptos Estadsticos Fundamentales
Hasta ahora hemos visto el caso de fenmenos o experimentos cuyo espacio muestral asociado
tiene un nmero pequeo de elementos. Esto nos sirvi para introducir la nocin de probabilidad.
Pero en muchos casos es necesario trabajar con experiencias o procesos que generan un nmero
muy grande de datos o resultados numricos, es decir, espacios muestrales con un nmero
infinito o muy grande de elementos. Cuando tenemos un conjunto muy grande de datos
numricos para analizar decimos que tenemos un Universo o Poblacin de observaciones.
La Estadstica trabaja con poblaciones de datos y con muestras extradas de las mismas. Los
conceptos de poblacin y muestra a veces resultan ambiguos en su aplicacin prctica. Por
5
ejemplo, supongamos que en una ciudad de 5000 habitantes se realiza un censo mdico en el
cual se mide el peso, la altura y se relevan otros datos de todos los habitantes de la ciudad.
Alguien podra referirse al universo o poblacin censada teniendo in mente el conjunto de los
habitantes de la ciudad. Pero cuando hablamos en trminos estadsticos, nos referimos a
poblaciones o universos de datos.
Por ejemplo, el conjunto de todas las mediciones de altura (De los habitantes de la ciudad) es un
conjunto de datos y por lo tanto constituye un universo o poblacin de datos desde el punto de
vista estadstico. Otro universo o poblacin de datos son los pesos medidos (De los habitantes de
la ciudad). Pero la poblacin de habitantes, es decir, las personas que habitan la ciudad no son la
poblacin a la que nos estamos refiriendo desde el punto de vista estadstico.
Supongamos que en una empresa se fabrica un lote muy grande, digamos 10 toneladas de un
producto qumico, y un tcnico debe controlar la calidad del mismo.
El tcnico toma una pequea porcin, por ejemplo, 100 gramos y dir que tom una muestra del
producto para analizar en el laboratorio. Hasta el momento, la muestra no fue analizada y por lo
tanto no tenemos ningn dato numrico.
Cuando el laboratorio efecta algn ensayo en la muestra y obtiene un resultado numrico,
recin ah tenemos un dato que puede ser analizado desde el punto de vista estadstico.
Vamos a suponer hipotticamente que el tcnico contina sacando otras muestras del producto,
hasta agotar el lote y cada una es ensayada en el laboratorio, el cual nos da los resultados. Como
tenamos 10 ton. de producto y las muestras son aproximadamente de 100 gr., el tcnico
seguramente extraer alrededor de 100000 muestras y el laboratorio nos entregar alrededor de
100000 resultados. Este conjunto de datos numricos es nuestro universo o poblacin de datos.
Si nosotros tomamos al azar 10 de esos resultados, podemos decir que tenemos una muestra de
10 elementos de ese universo o poblacin. No debemos confundir esta muestra (Desde el punto
de vista estadstico) con la muestra de material que extrajo el tcnico para ser analizada en
laboratorio.
Ahora bien, nuestro universo o poblacin de datos a veces no existe en la realidad, sino que es un
concepto o abstraccin que utilizamos para referirnos al universo o poblacin que
hipotticamente podra existir.
Veamos el ejemplo anterior. Supongamos que el tcnico toma solamente 5 muestras y las enva
para analizar al laboratorio. El laboratorio nos enviar slo 5 resultados, y nosotros diremos que
tenemos una muestra de datos extrada del universo o poblacin de datos total. Y estamos
pensando en el universo o poblacin que tendramos si se hubieran extrado y analizado las
100000 muestras de material.
Muchas veces resulta difcil imaginarse cual es el universo del cual extrajimos los datos.
Supongamos que tenemos una mquina que produce piezas de plstico en serie y un tcnico
toma 5 piezas sucesivas y les mide la altura con un calibre. Tenemos, entonces, 5 resultados, es
decir una muestra de 5 elementos. Cul es el universo al cual pertenece esa muestra de datos?.
Debemos imaginar lo siguiente: Si la mquina continuara trabajando en las mismas condiciones
(Es decir, a la misma velocidad, con las mismas materias primas, a la misma temperatura,
manejada por el mismo operario, etc.) ...y a cada pieza que produce se le mide la altura
tendramos un conjunto muy grande de resultados numricos. Ese conjunto muy grande de
resultados numricos que no existe, pero que podra obtenerse en esas condiciones es el universo
o poblacin del cual extrajimos la muestra de 5 observaciones.
6
Veamos otro ejemplo. Supongamos que el sindicato de la industria textil desea saber cual es el
sueldo promedio que gana un operario en esa industria. Entonces, encarga una encuesta a una
empresa especializada, que entrevista a 20 operarios de la industria textil y averigua sus salarios.
Estos datos son una muestra de 20 observaciones del universo o poblacin formado por los
salarios de todos los operarios de la industria textil del pas. Aunque el encuestador no disponga
de esos datos, sabemos que existen miles de operarios que ganan un salario determinado y por lo
tanto podemos hablar de un universo o poblacin cuyos elementos son los salarios de los
operarios de la industria textil en el pas. Adems, esa poblacin de datos es seguramente
diferente de la poblacin de salarios de los operarios de la industria textil chilena o brasilea
(Usando una misma moneda de referencia).
Qu representa una Poblacin de datos? El anlisis estadstico de una poblacin o universo de
datos tiene como objetivo final descubrir las caractersticas y propiedades de aquello que gener
los datos. Por ejemplo, se tiene una poblacin de escolares (Poblacin fsica, poblacin humana)
y se les mide la altura. El conjunto de datos de altura constituye una poblacin o universo
estadstico. El anlisis de estos datos de altura (Universo estadstico) sirve para caracterizar y
estudiar a la poblacin de estudiantes (Que no es una Poblacin estadstica).
Supongamos que un instituto dedicado a estudios econmicos ha realizado una encuesta de
ingresos en el pas. El universo de datos generados por la encuesta sirve a los fines de
caracterizar a la poblacin fsica, a la poblacin real del pas, desde un punto de vista econmico.
Un ingeniero controla un proceso industrial, que genera a diario muchos lotes de un producto
(Poblacin de lotes). Para cada lote se mide una caracterstica de calidad, obtenindose una gran
cantidad de resultados numricos (Poblacin de datos).
El ingeniero realiza esta tarea no porque est interesado en jugar con nmeros, sino porque a
travs de los datos numricos obtenidos se puede evaluar el comportamiento del proceso, que es
lo que realmente le interesa.
Entonces, es importante destacar que detrs de un universo o poblacin de datos se encuentra
una poblacin fsica subyacente, formada por elementos de la realidad que nos rodea, de la cual,
7
a travs de algn tipo de medicin, se obtuvieron los datos numricos. Es esa poblacin fsica
subyacente (Elementos de la realidad, seres humanos, lotes de material, etc.) la que deseamos
estudiar y caracterizar por medio del anlisis estadstico de los datos obtenidos. La poblacin
estadstica est representando, entonces, una poblacin fsica o natural formada por elementos de
la realidad, con respecto a una caracterstica o propiedad de esa poblacin fsica.
Es muy importante, al utilizar mtodos estadsticos, no confundir la poblacin fsica, formada
por elementos de la realidad que estamos estudiando, con la poblacin o universo de datos
generados a partir de la primera. De aqu en adelante, cuando utilicemos los trminos poblacin
o universo sin otro aditamento nos estaremos refiriendo a poblacin o universo de datos
numricos (Tambin llamados observaciones o mediciones o valores).
La Distribucin de Frecuencias
Vimos que una Poblacin o Universo de datos es un conjunto muy grande de nmeros. Estos
nmeros pueden estar en un gran listado o puede ser un conjunto hipottico, es decir, podemos
imaginar los nmeros pero no los tenemos realmente. Una gran tabla de nmeros ordenados al
azar prcticamente no nos muestra informacin acerca de la poblacin de datos. Suponiendo que
disponemos de los datos del universo, cmo podemos clasificar y ordenar los nmeros para
obtener ms informacin acerca de ese universo de datos?
Una forma sera escribir los nmeros desde el menor hasta el mayor y colocar encima de cada
uno tantas cruces o cuadraditos como veces que figure repetido en la poblacin:
El nmero de veces que aparece repetido cada dato es la frecuencia de dicho valor. La
representacin grfica que hemos visto se denomina Distribucin de Frecuencias de la poblacin.
La representacin grfica nos permite ver informacin que antes no apareca tan evidente. Por
ejemplo, sin hacer ningn clculo nos damos cuenta donde est aproximadamente el promedio
de la poblacin:
Tambin nos muestra cuales son los valores mximo y mnimo de la poblacin, es decir, el
rango:
8
En el caso anterior, los datos de la poblacin son nmeros enteros. Cuando los nmeros no son
enteros o cuando tenemos un nmero muy grande de datos, se divide el rango total en
subintervalos y se cuenta el nmero de valores que cae dentro de cada subintervalo.
Vamos a suponer, ahora, que tenemos una cierta poblacin de N = 500 datos, por ejemplo el peso
de varones adultos de 40 aos. Una manera de caracterizar esta poblacin es construir una
distribucin de frecuencias o grfico de frecuencias. Para ello seguimos los pasos siguientes:
1) Tomamos nota del valor mximo y el valor mnimo de la serie de datos que estamos
considerando.
2) Subdividimos el intervalo entre el mximo y el mnimo en algn nmero de intervalos (15
20) mas pequeos iguales entre s.
3) Contamos el nmero de datos que encontramos dentro de cada intervalo (Frecuencia). Por
ejemplo, supongamos que en el intervalo i hay ni observaciones (S ni = N).
4)Para construir el grfico, colocamos en el eje de abcisas (Horizontal) los intervalos y
levantamos en cada intervalo un rectngulo de altura proporcional al nmero ni de datos dentro
del mismo.
Si hacemos el rea del rectngulo levantado sobre el intervalo i-simo igual a la frecuencia
relativa ni/N, el rea total bajo el histograma ser igual a la unidad:
Obtenemos as una representacin grfica (Llamada tambin histograma) que nos muestra la
distribucin de frecuencias de la poblacin:
Esta distribucin de frecuencias nos muestra las caractersticas de una poblacin, por ejemplo, si
hay resultados que son mas frecuentes que otros. Nos muestra si los valores estn ubicados
9
alrededor de un valor central, si estn muy dispersos o poco dispersos. Podemos observar que
fraccin de todas las mediciones cae por ejemplo, entre 70 y 80 Kg. (Zona rayada en el grfico):
Si elegimos una persona del grupo y la pesamos, el resultado es un dato que pertenece a la
poblacin de datos representada en el grfico. Decimos, entonces, que estamos extrayendo un
dato de la poblacin de datos. Pero hay distintas maneras de elegir la persona, es decir, distintas
maneras de realizar la extraccin del dato.
Si nos paramos frente al grupo y elegimos una persona, estaremos seleccionando al ms gordo, al
ms flaco o al ms alto (y por lo tanto pesa ms que otros), de acuerdo a criterios subjetivos que
no podemos evitar.
En cambio, si escribimos los nombres de todas las personas en una etiqueta, metemos todas las
etiquetas en una caja y luego le pedimos a alguien que retire una etiqueta, la seleccin no estar
influda por nuestra subjetividad. En este caso, decimos que la extraccin es aleatoria.
Una extraccin aleatoria es aquella en que cada miembro de la poblacin tiene la misma
posibilidad de ser elegido. Supongamos que realizamos una extraccin aleatoria de la poblacin
antedicha y obtenemos el valor y.
Entonces:
1) La probabilidad P(y<70) de que y sea menor que 70 Kg. es igual al rea del histograma a la
izquierda de 70 Kg.
2) La probabilidad P(y>70) de que y sea mayor que 70 Kg. es igual al rea del histograma a la
derecha de 70 Kg.
3) La probabilidad P(y>70, y<80) de que y sea mayor que 70 Kg. pero menor que 80 Kg. es
igual al rea del histograma entre 70 y 80 Kg.
3.- Medidas de Tendencia Central
Medidas de Tendencia Central
Una caracterstica importante de cualquier poblacin es su posicin, es decir, donde est situada
con respecto al eje de abscisas (Eje horizontal). En nuestro caso, es importante saber si los datos
se agrupan alrededor de 60 Kg. o de 90 Kg. o alrededor de 12 Kg. Una manera de obtener un
dato numrico que nos d idea de la posicin de nuestra poblacin es calcular el Promedio o
Media de todas las observaciones:
10
Este importante parmetro nos permite efectuar comparaciones entre distintas poblaciones. Por
ejemplo, si tuviramos una poblacin formada por mediciones del peso de mujeres de 30 aos,
otra de peso de varones de 40 aos y una tercera de peso de nios de 8 aos, es indudable que los
promedios van a ser diferentes. El promedio, entonces, nos est diciendo que las tres poblaciones
son diferentes y tambin en que medida difieren.
Ahora, si tuviramos una poblacin de varones con peso promedio 70 Kg. y otra poblacin de
varones con el mismo promedio, se puede afirmar que ambas poblaciones son equivalentes? Para
responder esta pregunta necesitamos tener medidas de la dispersin de la poblacin de datos.
Medidas de Dispersin
La otra caracterstica muy importante de una poblacin es el grado de dispersin de las
observaciones. No es lo mismo si en nuestra poblacin encontramos que todos los valores estn
entre 75 y 90 Kg. que si estn entre 60 y 105 Kg., aunque el promedio sea el mismo. Si llegara a
la tierra un marciano y le dijramos que el peso promedio de los seres humanos adultos es de 70
Kg., puede llegar a creer que existen hombres de 350 Kg., o de 5 Kg.
Es necesario agregar alguna idea de la dispersin de los valores. Una manera es a travs del
Rango de las observaciones, es decir, el valor Mximo y el valor Mnimo de los datos de la
poblacin. Entonces, una descripcin mas realista acerca de los seres humanos sera decir que
pesan en promedio 70 Kg. y que el rango es de 40 a 120 Kg. (Estos valores son supuestos).
Una manera mas precisa de dar idea de la dispersin de valores de una poblacin es a travs de la
Varianza o su raz cuadrada, que es la Desviacin Standard. Vamos a calcular la varianza y la
desviacin standard de un nmero pequeo de datos (Una muestra) para ilustrar el clculo.
Supongamos que se midi la altura de 10 personas adultas y de sexo femenino,y se obtuvieron
los valores siguientes:
165 cm.
163 cm.
171 cm.
156 cm.
162 cm.
159 cm.
162 cm.
168 cm.
159 cm.
167 cm.
El promedio de estas observaciones es:
165
1,8
163
-0,2
171
7,8
156
-7,2
162
-1,2
159
-4,2
162
-1,2
168
4,8
159
-4,2
167
3,8
Los residuos tambin nos dan una idea de la dispersin de las observaciones individuales
alrededor del promedio. Si el valor absoluto (El valor numrico sin el signo) de los residuos es
grande, es porque los valores estn muy dispersos. Si el valor absoluto de los residuos es
pequeo, significa que las observaciones individuales estn muy cerca del promedio, y por lo
tanto, hay poca dispersin.
Pero nosotros necesitamos un slo nmero que nos provea informacin acerca de la dispersin
de los valores. Si sumamos los residuos, como algunos son positivos y otros negativos, se
cancelaran entre s, con lo cual perdemos la informacin acerca de la dispersin. Entonces, los
elevamos al cuadrado:
12
165
1,8
3,24
163
-0,2
0,04
171
7,8
60,84
156
-7,2
51,84
162
-1,2
1,44
159
-4,2
17,64
162
-1,2
1,44
168
4,8
23,04
159
-4,2
17,64
167
3,8
14,44
Si ahora sumamos los residuos elevados al cuadrado, tenemos un nmero donde se condensa
toda la informacin de la dispersin de la poblacin:
Este nmero, la suma de cuadrados, es dependiente del nmero de datos N, y por lo tanto no nos
sirve para comparar poblaciones con distinto nmero de observaciones.
Pero si dividimos la suma de cuadrados por N, tenemos un nmero que es independiente del
nmero de observaciones, que se denomina Varianza:
En nuestro caso:
Las frmulas anteriores son las que se aplican al clculo de la varianza y desviacin standard de
una poblacin de datos. Mas adelante veremos que las frmulas a aplicar en el caso de una
muestra son ligeramente diferentes. La varianza es un nmero que nos permite comparar
poblaciones. Cuando la dispersin de las observaciones es grande (Datos que se alejan mucho
por encima y por debajo del promedio), el valor de los residuos (distancia entre cada dato y el
promedio) ser grande. Entonces aumenta la suma de cuadrados de los residuos y por lo tanto la
varianza.
Tambin se utiliza la raz cuadrada de la varianza:
Por lo tanto:
La desviacin standard o desviacin tpica tiene las mismas unidades que la variable con la que
estamos trabajando, en nuestro caso el centmetro. Tanto la varianza como la desviacin standard
nos permiten comparar el grado de dispersin de distintas poblaciones.
Media y Varianza de una Muestra
Hasta ahora hemos visto como se calcula la media o promedio de una poblacin y tambin como
se calcula la varianza y la desviacin standard de una poblacin o universo de observaciones.
Cuando tenemos una muestra (Subconjunto de algunos datos extrados de una poblacin),
tambin podemos calcular su media, su varianza y su desviacin standard. Es muy importante
distinguir entre la media, varianza y desviacin standard poblacional, de la media, varianza y
desviacin standard muestral.
La media, varianza y desviacin standard de una poblacin o universo se denominan parmetros
de la poblacin y en general se designan con letras griegas: m para la Media, s2 para la Varianza
y s para la Desviacin Standard poblacionales. En el caso de una muestra, la media, varianza y
desviacin standard se denominan estadsticos y se utilizan letras de nuestro alfabeto:
13
para la Media
s2
para la Varianza
solamente una estimacin del resultado que se hubiera obtenido si la consulta se hubiera
efectuado sobre toda la poblacin de votantes.
Ahora bien, cmo se obtiene una muestra representativa?
Para tratar de entenderlo, vamos a trabajar con una poblacin de muy pocos datos. Supongamos
que nuestra poblacin son 10 bolillas con los siguientes nmeros:
Frecuencia
15
En una poblacin de muchos datos, no es posible obtener una muestra eligiendo cada elemento
para que figure en la misma proporcin que en la poblacin, porque para ello deberamos
disponer de todos los datos de la misma, y en ese caso no sera necesario sacar una muestra. Si a
cada elemento de la poblacin se le da la misma oportunidad de ser elegido, entonces se supone
que cada nmero estar en la muestra en un nmero proporcional a la cantidad de veces que est
en la poblacin. Por ejemplo, el 2 va a estar en la muestra mas veces que el 5, porque en la
poblacin hay 6 dos y slo 2 cincos. Si metemos las diez bolillas en una bolsa y las mezclamos
suficientemente, la probabilidad que tiene una bolilla individual de ser extrada es la misma para
cualquiera de las bolillas. En esas condiciones, si sacamos cinco bolillas sucesivas, mezclndolas
previamente en cada oportunidad, es razonable pensar que vamos a extraer el 2 en mas
oportunidades que el 5 el 9. Esta forma de obtener la muestra es lo que se conoce como
Muestreo Aleatorio.
El muestreo aleatorio no garantiza que la muestra va a ser representativa de la poblacin, pero al
eliminar toda influencia externa en el acto de extraer un elemento de la poblacin, la proporcin
de cada uno estar influda slo por la cantidad de veces que est presente en la poblacin de la
cual se extrae la muestra.
Entonces, realizando el muestreo en forma aleatoria (al azar), la probabilidad de obtener una
muestra representativa de la poblacin es mayor que si en la eleccin de los elementos de la
muestra interviene la voluntad del que efecta la operacin o algn otro factor de influencia.
4.- Funciones de Distribucin de Probabilidades
Hemos visto como se construye un grfico de frecuencias con datos extrados de una poblacin.
A medida que aumentamos la cantidad de observaciones que tomamos de la poblacin, podemos
construir nuestro grfico con un nmero mayor de intervalos, aunque de menor amplitud (El
rango total cubierto por la poblacin es el mismo).
16
Si continuamos este proceso, con intervalos cada vez mas estrechos y numerosos, los altibajos en
el grfico de la distribucin de frecuencias tienden a desaparecer:
17
En el lmite, el ancho del intervalo tiende a cero y la poblacin puede representarse por una
distribucin de probabilidad continua. Cuando, para representar esta distribucin de probabilidad
continua se utiliza una funcin matemtica, esta se denomina Funcin de Densidad de
Probabilidad. La forma de la curva en el grfico de la funcin de distribucin es caracterstica de
la poblacin de observaciones asociada con la misma, y depende de variables internas del
proceso que gener los datos de la poblacin.
Existen distintas funciones de distribucin tericas, cada una de las cuales est basada en un
modelo de comportamiento del proceso que gener el universo de observaciones. La aplicacin
de una de estas distribuciones tericas a una poblacin particular est justificada si las hiptesis
(suposiciones) del modelo de comportamiento del proceso que gener la poblacin se cumplen.
Dicho de otro modo, si conocemos el proceso, es decir, el conjunto de fenmenos que dieron
lugar a nuestra poblacin de mediciones u observaciones, y adems estamos seguros de que el
mismo se ajusta a un modelo de comportamiento determinado, entonces podemos decir que la
distribucin de probabilidades de nuestra poblacin es la que corresponde al modelo.
En la prctica, se sabe que ciertos procesos y fenmenos generan resultados numricos cuya
distribucin de probabilidades se puede ajustar a determinados modelos tericos. Por ejemplo, el
nmero de partculas alfa emitidas por un material radiactivo sigue una distribucin de Poisson.
Existen muchas otras distribuciones tericas, como la Binomial, la Exponencial, la de Weisbull,
etc. Cada una de ellas tiene su propio campo de aplicacin, que se sostiene en un determinado
comportamiento de los fenmenos, y al aplicarla se est haciendo en forma implcita la
suposicin de que se cumplen las suposiciones del modelo subyacente.
La Distribucin Normal
Una importante distribucin terica es la Distribucin Normal o de Gauss. La ecuacin
matemtica de la funcin de Gauss es la siguiente:
La distribucin normal es una curva con forma de campana, con eje de simetra en el punto
correspondiente al promedio del universo m. La distancia entre el eje de simetra de la campana
y el punto de inflexin de la curva es igual a s, la desviacin standard de la poblacin:
18
El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida entre m-s y
m+s es aproximadamente igual a 0,68 del rea total; entre m-2s y m+2s es aproximadamente
igual a 0,95 del rea total:
Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la distribucin
normal son m y s (Media y desviacin standard de la poblacin). Con estos dos parmetros
sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su
ancho (Determinado por la desviacin standard).
Cuando nos encontramos con una poblacin de observaciones, si podemos afirmar que la
distribucin correspondiente es normal, slo hace falta estimar la media y la desviacin standard
para tener toda la informacin necesaria acerca de dicha poblacin.
La Distribucin Normal Standard
Podemos escribir la frmula de la distribucin normal de la siguiente manera:
Si llamamos Z a la cantidad
la funcin queda as:
19
De esta manera tenemos tabulada una funcin de Gauss que no depende de cual sea el promedio
y la desviacin standard de nuestra poblacin real. El cambio de variable hace que se conserve la
forma de la funcin y que sirva para cualquier poblacin, siempre y cuando esa poblacin tenga
una distribucin normal.
Cuando queremos calcular las probabilidades para una poblacin real, calculamos Z y entramos
en la tabla de la funcin normal standard:
La Distribucin T de Student
20
El estadstico T tiene una distribucin que se denomina distribucin T de Student, que est
tabulada para 1, 2, 3, ... etc. grados de libertad de la muestra con la cual se calcul la desviacin
standard. La distribucin T tiene en cuenta la incertidumbre en la estimacin de la desviacin
standard de la poblacin, porque en realidad la tabla de T contiene las distribuciones de
probabilidades para distintos grados de libertad:
Para un nmero de grados de libertad pequeo, es mas ancha que la distribucin normal
tipificada. Cuando los grados de libertad tienden a infinito, la distribucin T tiende a coincidir
con la distribucin normal standard. Es decir, en la medida que aumentemos el nmero de
observaciones de la muestra, la desviacin standard calculada estar mas prxima a la desviacin
standard de la poblacin y entonces la distribucin T correspondiente se acerca a la distribucin
normal standard. El uso de la distribucin T presupone que la poblacin con que estamos
trabajando tiene una distribucin normal.
Distribucin de Promedios Muestrales
Para comprender que significa distribucin de promedios muestrales, vamos a suponer que
realizamos un experimento con bolilleros como los usados en la lotera. Colocamos un nmero
muy grande de bolillas blancas en un bolillero blanco, en cada una de las cuales figura un dato
X. Este bolillero representa la poblacin de observaciones X, y tiene media m y varianza s2.
Supongamos que a continuacin hacemos los siguiente:
1) Tomamos una muestra de n=10 bolillas blancas.
21
2)Calculamos la media
Varianza
s2
Desv. Standard
Forma de la curva
22
Cualquiera
Distrib. de
M
ms cerca de la
Normal
En general, en los problemas que se presentan habitualmente, existe una poblacin de
observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual
intentamos conocer todo lo que sea posible acerca de la poblacin de la cual fue extrada. El
promedio de la muestra de n elementos pertenece a la distribucin de promedios muestrales de la
poblacin original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos
promedios muestrales que se distribuyen alrededor de m con desviacin standard:
Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribucin de promedios
con desviacin standard mas pequea, por lo cual, el promedio de la muestra estar mas cerca
del promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es
una estimacin del promedio del universo.
5.- Test de Hiptesis
El contraste de hiptesis o test de hiptesis es una herramienta muy importante y ampliamente
utilizada para comparar mediciones y tomar decisiones basadas en una probabilidad. Vamos a
explicarlo con un ejemplo. Supongamos que en una huerta se cultivan tomates en un terreno
donde hay sembradas 300 plantas de tomates, utilizando un determinado tipo de fertilizante.
El agricultor desea probar un nuevo fertilizante, basndose en la propaganda de una revista de
horticultura.
Con este fin, en la siguiente cosecha utiliza el nuevo fertilizante en una de las plantas, en la que
obtiene 12,5 Kg. de tomates. Cmo saber si el rendimiento en esta planta fue mejor porque se
utiliz un nuevo fertilizante? Indudablemente necesitamos comparar este valor con el
rendimiento de las otras plantas en las que se us el fertilizante habitual. Los rendimientos de
distintas plantas seguramente fluctan al azar:
...Etc.
Es decir, no tenemos un nico resultado con el fertilizante anterior sino muchos resultados que
varan aleatoriamente, y es posible que algunos de esos resultados superen los 12,5 Kg. Se
necesita, entonces, un criterio para decidir si el nuevo fertilizante produce una mejora en el
rendimiento.
Para resolver el problema, necesitamos hacer algunas suposiciones.
Primero: El conjunto de resultados de muchas plantas de tomate con el primer fertilizante
constituye un universo conceptual de observaciones de distribucin normal. Hablamos de
universo conceptual o hipottico porque es el universo o poblacin de resultados que tendramos
con un nmero enormemente grande de plantas, con el mismo fertilizante y en las mismas
condiciones.
23
El nico resultado obtenido con el nuevo fertilizante es 12,5 Kg., lo cual supera el promedio del
universo de resultados obtenidos con el fertilizante anterior.
Si bien el promedio es 10,7 Kg., en la poblacin hay resultados ms altos, y tal vez algunos
iguales o mayores que 12,5 Kg. Se puede decir, entonces, que el nuevo fertilizante produce
mejores resultados? Para tomar la decisin, conviene razonar de la siguiente manera:
24
Ahora bien, para estar totalmente seguro y antes de invertir dinero en comprar una cantidad
importante del fertilizante, el agricultor decide hacer una nueva prueba, y en la cosecha siguiente
utiliza el nuevo producto en 10 plantas de tomate, con lo cual la prueba es mas segura. Las
hiptesis a contrastar son las mismas, pero el clculo es algo diferente.
Ahora tenemos 10 resultados, cuyo promedio vamos a suponer que sea 11,5 Kg. Estos 10
resultados constituyen una muestra del universo de rendimientos individuales de las plantas. Pero
el promedio 11,5 Kg. es un elemento del universo de promedios muestrales (Promedios de 10
resultados) derivado del universo anterior, con el mismo promedio que este y con desviacin
standard:
26
Cuando realizamos una experiencia individual donde el resultado debe ser slo uno de dos
posibles: acierto/fallo, cara/ceca, etc. decimos que es un ensayo de Bernouilli. Es tan probable
sacar 1 2 ases como sacar 5 ases?. A priori parecera que no. En nuestro caso, cada vez que
arrojamos un dado podemos definir nuestro experimento registrando slo dos resultados
posibles:
27
Y sabemos que hay cinco maneras diferentes de obtener un As en cinco dados arrojados:
28
Cmo podemos generalizar el clculo de las distintas formas de obtener 1 As, 2 Ases, etc. en
cinco dados arrojados? La respuesta la dan los nmeros combinatorios:
donde
29
donde
Los trminos de la suma son las probabilidades P(y), que determinan la distribucin de
probabilidades de la variable aleatoria y, la cual es una variable discreta (toma los valores 0, 1, 2,
...etc.). Aplicando la frmula al caso de 5 dados:
30
La varianza de Y es:
Cmo interpretamos este resultado? Si bien el promedio resulta un valor fraccionario, nos est
diciendo que al arrojar los cinco dados estaremos ms cerca de sacar 1 As que de sacar 2 o ms
ases. De una manera ms rigurosa, ese valor nos dice que si se repitiera la experiencia muchas
veces, el promedio del nmero de ases que se obtendra en todos los experimentos sera igual a
0.83
La varianza de Y resulta:
Y la desviacin standard:
31
Volvamos, ahora a nuestro apostador. Supongamos que arroja 5 dados y apuesta a que va a sacar
3 o ms ases. Cul es la probabilidad que tiene de ganar?
Esta probabilidad es la suma de los trminos del binomio para 3, 4 y 5 aciertos (ases), es decir:
etc...
Supongamos que estos datos se registran en un grfico de lneas en funcin del tiempo:
32
Observamos una lnea quebrada irregular, que nos muestra las fluctuaciones del peso de las
piezas a lo largo del tiempo. Esta es la fluctuacin esperable y natural del proceso. Los valores se
mueven alrededor de un valor central (El promedio de los datos), la mayor parte del tiempo cerca
del mismo. Pero en algn momento puede ocurrir que aparezca uno o ms valores demasiado
alejados del promedio.
Cmo podemos distinguir si esto se produce por la fluctuacin natural del proceso o porque el
mismo ya no est funcionando bien?
Esta es la respuesta que provee el control estadstico de procesos, y a continuacin veremos
como lo hace.
Todo proceso de fabricacin funciona bajo ciertas condiciones o variables que son establecidas
por las personas que lo manejan para lograr una produccin satisfactoria.
Cada uno de estos factores est sujeto a variaciones que realizan aportes ms o menos
significativos a la fluctuacin de las caractersticas del producto, durante el proceso de
fabricacin. Los responsables del funcionamiento del proceso de fabricacin fijan los valores de
algunas de estas variables, que se denominan variables controlables. Por ejemplo, en el caso de
la inyectora se fija la temperatura de fusin del plstico, la velocidad de trabajo, la presin del
pistn, la materia prima que se utiliza (Proveedor del plstico), etc.
Pero un proceso de fabricacin es una suma compleja de eventos grandes y pequeos. Hay una
gran cantidad de variables que sera imposible o muy difcil controlar. Estas se denominan
variables no controlables. Por ejemplo, pequeas variaciones de calidad del plstico, pequeos
cambios en la velocidad del pistn, ligeras fluctuaciones de la corriente elctrica que alimenta la
mquina, etc.
Los efectos que producen las variables no controlables son aleatorios. Adems, la contribucin
de cada una de las variables no controlables a la variabilidad total es cuantitativamente pequea.
33
Antes de pasar a la segunda etapa, se verifica si el proceso est ajustado. En caso contrario, se
retorna a la primera etapa:
34
En la 1a etapa se recogen unas 100-200 mediciones, con las cuales se calcula el promedio y la
desviacin standard:
Entonces, se construye un grfico de prueba y se traza una lnea recta a lo largo del eje de
ordenadas (Eje Y), a la altura del promedio (Valor central de las observaciones) y otras dos lneas
rectas a la altura de los lmites de control:
35
En este grfico se representan los puntos correspondientes a las observaciones con las que se
calcularon los lmites de control:
Este grfico de prueba se analiza detenidamente para verificar si est de acuerdo con la hiptesis
de que la variabilidad del proceso se debe slo a un sistema de causas aleatorias o si, por el
contrario, existen causas asignables de variacin. Esto se puede establecer porque cuando la
fluctuacin de las mediciones se debe a un sistema constante de causas aleatorias la distribucin
de las observaciones es normal:
Cuando las observaciones sucesivas tienen una distribucin normal, la mayor parte de los puntos
se sita muy cerca del promedio, algunos pocos se alejan algo ms y prcticamente no hay
ninguno en las zonas ms alejadas:
36
Es difcil decir como es el grfico de un conjunto de puntos que siguen un patrn aleatorio de
distribucin normal, pero s es fcil darse cuenta cuando no lo es. Veamos algunos ejemplos de
patrones No Aleatorios:
Una sucesin de puntos por encima ...
37
Si no se descubren causas asignables entonces se adoptan los lmites de control calculados como
definitivos, y se construyen cartas de control con esos lmites:
Si slo hay pocos puntos fuera de control (2 3), estos se eliminan, se recalculan la media,
desviacin standard y lmites de control con los restantes, y se construye un nuevo grfico de
prueba. Cuando las observaciones no siguen un patrn aleatorio, indicando la existencia de
causas asignables, se hace necesario investigar para descubrirlas y eliminarlas. Una vez hecho
esto, se debern recoger nuevas observaciones y calcular nuevos lmites de control de prueba,
comenzando otra vez con la primera etapa.
En la 2 etapa, las nuevas observaciones que van surgiendo del proceso se representan en el
grfico, y se controlan verificando que estn dentro de los lmites, y que no se produzcan
patrones no aleatorios:
38
Como hemos visto, el 99,8 % de las observaciones deben estar dentro de los lmites de 3,09
sigmas alrededor de la media. Esto significa que slo 1 observacin en 500 puede estar por
causas aleatorias fuera de los lmites de control. Entonces, cuando se encuentra ms de 1 punto
en 500 fuera de los lmites de control, esto indica que el sistema de causas aleatorias que
provocaba la variabilidad habitual de las observaciones ha sido alterado por la aparicin de una
causa asignable que es necesario descubrir y eliminar.
En ese caso, el supervisor del proceso debe detener la marcha del mismo e investigar con los que
operan el proceso hasta descubrir la o las causas que desviaron al proceso de su comportamiento
habitual. Una vez eliminadas las causas del problema, se puede continuar con la produccin
normal.
8.- Grficos X-R
Los grficos X-R se utilizan cuando la caracterstica de calidad que se desea controlar es una
variable continua.
Para entender los grficos X-R, es necesario conocer el concepto de Subgrupos (o Subgrupos
racionales). Trabajar con subgrupos significa agrupar las mediciones que se obtienen de un
proceso, de acuerdo a algn criterio. Los subgrupos se realizan agrupando las mediciones de tal
modo que haya la mxima variabilidad entre subgrupos y la mnima variabilidad dentro de cada
subgrupo. Por ejemplo, si hay cuatro turnos de trabajo en un da, las mediciones de cada turno
podran constituir un subgrupo.
39
Supongamos una fbrica que produce piezas cilndricas para la industria automotriz. La
caracterstica de calidad que se desea controlar es el dimetro de las piezas.
Hay dos maneras de obtener los subgrupos. Una de ellas es retirar varias piezas juntas a
intervalos regulares, por ejemplo cada hora:
La otra forma es retirar piezas individuales a lo largo del intervalo de tiempo correspondiente al
subgrupo:
40
.....Etc.
Por cualquiera de los dos caminos, obtenemos grupos de igual nmero de mediciones. Para cada
subgrupo calculamos el Promedio y el Rango (Diferencia entre el valor mximo y el valor
mnimo).
41
Como ya se ha visto, para calcular los Lmites de Control es necesario obtener un gran nmero
de mediciones, divididas en subgrupos. En nuestro ejemplo, podramos obtener 30 subgrupos de
6 datos cada uno:
Despus de calcular el Promedio y el Rango de cada subgrupo, tendramos una tabla como la
siguiente:
Promedio de Subgrupo
N
Nmero de Subgrupos
o tambin:
42
Mediciones individuales
N
Nmero de Subgrupos
La desviacin standard del rango se puede calcular utilizando el coeficiente d3, que tambin
depende del nmero de mediciones en el subgrupo:
43
La variable aleatoria nmero de defectuosos es una variable aleatoria discreta, porque puede
tomar un nmero finito de valores, o infinito numerable. Los grficos np se utilizan para
controlar el nmero de defectuosos en una muestra.
Entonces, para controlar este proceso, un inspector se coloca al final de la lnea de produccin y
cada hora retira una muestra de n=50 tornillos (por ejemplo), comprueba cada uno con la rosca y
anota el nmero de defectuosos.
Este resultado se anota en un grfico hora por hora y se denomina grfico np.
Si se tomara del proceso un slo tornillo Cul es la probabilidad de que sea defectuoso?
Imaginando la poblacin de tornillos que podra fabricar el proceso trabajando siempre en las
mismas condiciones, una cierta proporcin p de estos seran defectuosos. Entonces, la
probabilidad de tomar un tornillo y que sea defectuoso es p.
En una muestra de n tornillos, la probabilidad de encontrar:
0 defectuosos
1 defectuoso
2 defectuosos
...
n defectuosos
N
Defectuosos
3
2
4
3
4
2
5
-
N Defectuosos en muestra i
n
N elementos en la muestra
N muestras
Con esto podemos calcular los Lmites de Control para el grfico np:
Ahora tenemos la superficie dividida en 4 zonas rectangulares de igual tamao. Observamos que
en algunas zonas aparece un defecto superficial y en otras no. Vamos a hacer las siguientes
suposiciones:
1) En cada zona slo puede aparecer 1 defecto.
2) Si la probabilidad de que aparezca un defecto en todo el rea es p, la probabilidad de que
aparezca un defecto en una zona es p/4.
47
Pero sabemos que en realidad en cada zona podran aparecer ms de 1 defecto. Esto hace
inexacto nuestro clculo.
Dividimos cada zona en 4 y ahora tenemos 16 zonas. La probabilidad de tener 1 defecto en una
zona es:
49
El nmero de defectos x en la superficie total es una variable aleatoria discreta que puede tomar
valores 0, 1, 2, 3, 4, ... y cuya distribucin de probabilidades se conoce como Distribucin de
Poisson.
La distribucin de Poisson tiene una propiedad cuyas consecuencias son muy importantes para el
Control Estadstico de Procesos. Supongamos que se tienen m variables aleatorias de Poisson:
50
Esto es muy importante porque podemos imaginar el producto fabricado por un proceso (Una
licuadora, una computadora, un televisor, etc.) como una superficie en la que se pueden producir
mltiples defectos, y donde el nmero de cada tipo de defecto es una variable aleatoria de
Poisson. Entonces, la propiedad mencionada nos permite tratar la suma de todos los tipos de
defectos como una variable aleatoria de Poisson. Esto se utiliza para el control del Nmero de
Defectos en un producto (Grficos C).
Supongamos ahora que tenemos un gran lote de artefactos, por ejemplo licuadoras. Tomamos
una muestra de m = 5 unidades y medimos el nmero total de defectos en las 5 unidades. Si
obtuvimos x1, x2, x3, ... xm defectos en cada unidad, el nmero total de defectos ser:
y es una variable aleatoria discreta que puede tomar valores 0, 1/m, 2/m, 3/m, ... etc. Cul es la
varianza de y?
La varianza de xi es
distribucin:
Por lo tanto:
Este es un importante resultado que se utilizar para calcular la varianza en los Grficos U.
11.- Grficos C y U
En algunos procesos interesa medir la cantidad de defectos que presentan las unidades de
producto que se estn fabricando. Por ejemplo, se fabrican telfonos celulares y entonces se toma
uno de ellos y se cuenta el nmero total de defectos. Estos podran ser:
51
Rayaduras en la superficie.
Rajaduras en el plstico
Antena defectuosa
Botn defectuoso.
Etc.
Los defectos pueden ser de diferentes tipos y se cuenta el total de todos estos defectos en la
unidad inspeccionada. Obtenemos un resultado que es el Nmero de Defectos por unidad de
inspeccin.
A medida que el proceso genera las unidades (Telfonos celulares), retiramos una unidad a
intervalos regulares y contamos el nmero total de defectos. En cada unidad podemos encontrar:
0 defectos
1 defecto
2 defectos
3 defectos
...
n defectos
52
Los grficos C se utilizan para controlar el nmero de defectos en una muestra del producto o
unidad de inspeccin. Entonces, para controlar este proceso, un inspector se coloca al final de la
lnea de produccin y cada hora retira una unidad de inspeccin (En este caso un telfono
celular), verifica y anota el nmero total de defectos.
Este resultado se anota en un grfico hora por hora y se denomina grfico C. De acuerdo a la
Distribucin de Poisson, si denominamos C al parmetro de la funcin de distribucin, el
promedio de la poblacin es C y la varianza tambin es C.
Para construir los grficos de control C, en una primera etapa se toman N unidades de inspeccin
(ms de 25 30) a intervalos regulares. Se cuenta en cada unidad de inspeccin el Nmero de
Defectos y se registra. Se obtendra una Tabla como la siguiente:
Unidad de
Nm.
Inspeccin Defectos
1
Entonces, a partir de la tabla podemos calcular C como promedio del Nmero de Defectos en las
muestras (Unidades de Inspeccin):
53
En caso de que el Lmite Inferior de Control resulte negativo, se le asigna valor cero.
Construmos entonces un Grfico C de prueba y representamos el nmero de defectos en las
muestras:
Tarjeta
Nm.
Defectos
etc
Esto se debe a que la fabricacin se realiza por medio de un proceso totalmente automatizado
donde ocurren pocos errores. Por lo tanto, el promedio de defectos ser cercano a cero y el
Lmite Inferior de Control seguramente ser negativo. Para evitar esto, es conveniente redefinir
la Unidad de Inspeccin. Por ejemplo, se puede tomar como unidad de inspeccin la cantidad de
100 tarjetas de sonido. Es decir, cada media hora se retiran del proceso 100 tarjetas y se cuentan
los defectos del total de las mismas. De esta manera la cantidad de defectos promedio por unidad
de inspeccin ser mas alta. Y es posible tambin que el LIC sea mayor que cero.
Supongamos que se est controlando el nmero de defectos en un proceso de ensamblado de
licuadoras y se define una unidad de inspeccin de 5 licuadoras. En este caso es posible trabajar
con un grfico C, como ya hemos visto. Pero tal vez se desea controlar el promedio de defectos
por cada licuadora (unidad de produccin) en lugar de el total de defectos para las 5 licuadoras
(unidad de inspeccin):
Se debe tener en cuenta que x es una nueva variable aleatoria discreta que toma valores 0, 1/m,
2/m, 3/m, 4/m, .....etc., y cuya distribucin de probabilidades se puede calcular a partir de la
Distribucin de Poisson.
Como en el caso de los grficos C, en una primera etapa se toman N unidades de inspeccin
(ms de 25 30) a intervalos regulares. Se cuenta en cada unidad de inspeccin el Nmero de
55
Defectos y se registra. Luego se divide el Nmero de Defectos de cada unidad de inspeccin por
m (Nmero de unidades de produccin en cada unidad de inspeccin).
En nuestro ejemplo (m = 5) la Tabla quedara as:
Unidad de
Nm.
Inspeccin Defectos
Nm.
Defectos por
Licuadora
1.0
1.6
1.2
10
2.0
1.0
15
3.0
12
2.4
1.0
Entonces, a partir de la tabla podemos calcular el parmetro U como promedio del Nmero de
Defectos por licuadora:
56
Capacidad de Proceso
Un proceso de fabricacin es un conjunto de equipos, materiales, personas y mtodos de trabajo
que genera un producto fabricado.
consideraremos que el proceso est bajo control estadstico, es decir que la variabilidad se debe
solamente a un sistema constante de causas aleatorias (No intervienen causas asignables).
Al realizar una sucesin de mediciones de la caracterstica de calidad sobre muestras del
producto fabricado, encontramos que los valores fluctan alrededor de un valor central. Esto es
lo que llamamos la fluctuacin natural y esperable del proceso. Esta variacin de la caracterstica
de calidad medida se debe a un conjunto muy grande de causas que afectan el proceso, cuyo
efecto individual es pequeo y que actan en forma aleatoria (Sistema constante de causas
aleatorias). La fluctuacin natural del proceso es inherente al mismo y no puede eliminarse, slo
puede reducirse realizando modificaciones al proceso mismo, lo cual significa, como ya hemos
dicho, trabajar con otro proceso. La fluctuacin natural de un proceso puede cuantificarse a
travs de la desviacin standard del mismo, con la cual podemos calcular Lmites de Tolerancia
Natural del proceso. Se debe insistir en que estos lmites no pueden fijarse voluntariamente,
dependen del proceso y de las variables no controlables del mismo. Generalmente se toma un
rango para la fluctuacin natural de 6 sigmas.
Los Lmites de Especificacin de un producto son fijados voluntariamente por el cliente, por el
fabricante o por alguna norma. Estos lmites constituyen un requisito a cumplir por el producto y
no deben confundirse en ningn caso con los Lmites de Control o con los Lmites de Tolerancia
Natural del proceso.
La Capacidad de un proceso es la aptitud para generar un producto que cumpla con determinadas
especificaciones. En el mejor de los casos, es conveniente que los Lmites de Tolerancia Natural
del proceso se encuentren dentro de los Lmites de Especificacin del producto. De esta manera
nos aseguramos que toda la produccin cumplir con las especificaciones.
Para analizar la capacidad del proceso se puede utilizar un histograma de frecuencias. Si se
dispusiera de todos los datos del universo para la caracterstica de calidad medida y se hiciera un
histograma este permitira tener una idea exacta de la fluctuacin natural del proceso. Como esto
es imposible, es necesario tomar un cierto nmero de mediciones (Mnimo 100-200) y efectuar
con ellas un histograma de frecuencias.
Este es el histograma de una muestra y por lo tanto es slo una estimacin del verdadero
histograma del universo. Si representamos en las abscisas los Lmites de Especificacin del
producto, podemos ver grficamente si el proceso tiene aptitud (Capacidad) para fabricar dicho
producto.
58
Para cuantificar la Capacidad de Proceso se utilizan coeficientes que permiten comparar el rango
de especificaciones con la fluctuacin natural del proceso. Uno de ellos es Cp:
donde
LSE es el Lmite Superior de Especificacin y LIE es el Lmite Inferior de Especificacin
Si el proceso tiene capacidad para fabricar el producto, entonces Cp > 1. En general se exige Cp
> 1.30 para mayor seguridad.
Este coeficiente tiene el inconveniente de que para poder aplicarlo el centro de gravedad del
rango de especificaciones debe coincidir con la tendencia central de las mediciones del proceso.
Cuando esto no ocurre se emplea el Cpk:
Donde:
59
En el grfico podemos observar que una buena parte del producto est por encima del Lmite
Superior de Especificacin (LSE). An as resulta Cp > 1, indicando errneamente que el
proceso tiene capacidad suficiente. En este caso se debe usar el segundo coeficiente que muestra
claramente que el proceso no tiene capacidad suficiente (Cpk < 1), tal como se puede observar en
el grfico.
El uso de un histograma para analizar la capacidad de un proceso tiene la ventaja de que se
puede apreciar la forma de la distribucin, con lo cual se puede confirmar o rechazar la hiptesis
de que la misma es normal. Pero el problema es que no se puede detectar la presencia de
patrones no aleatorios, con lo cual no es posible confirmar o rechazar la hiptesis de que el
proceso est bajo control estadstico. Si el proceso no est bajo control estadstico los resultados
del anlisis de la capacidad de proceso no sern vlidos y pueden llevar a conclusiones
equivocadas.
Otra manera de analizar la capacidad de un proceso es por medio de los grficos de control. La
implementacin de grficos de control exige necesariamente colocar al proceso bajo control
estadstico. En consecuencia, se puede utilizar la desviacin standard utilizada para calcular los
Lmites de Control para calcular los coeficientes de capacidad de proceso Cp o Cpk. Si este es el
caso, se debe hacer una aclaracin muy importante. Cuando se utilizan grficos X-R, en el
grfico de X se representan los promedios de subgrupos, es decir, promedios muestrales. No se
debe confundir la desviacin standard del proceso con la desviacin standard de los promedios
muestrales. Si la desviacin standard del proceso es s y cada subgrupo tiene m mediciones, la
desviacin standard entre subgrupos es:
Si se utiliza por error la desviacin standard entre subgrupos para calcular los coeficientes de
capacidad del proceso, se obtendrn valores ms altos que los que corresponden a la verdadera
capacidad del proceso.
60