Está en la página 1de 57

Anlisis de Capacidad del

Proceso en la Ausencia de
Normalidad
Dr. Eduardo Santiago
Minitab Inc.

2014 Minitab, Inc.

Objetivos
1. Repaso de supuestos del Anlisis de Capacidad para
datos normalmente distribuidos
2. Generar un Anlisis de Capacidad para datos que no
siguen una distribucin normal utilizando diferentes
tcnicas
3. Qu situacin produce datos no-normales?
4. Desventajas de las pruebas de Normalidad
5. Cmo manejar datos que provienen de un sistema de
medicin con baja discriminacin?

2014 Minitab, Inc.

Cmo validar los supuestos?

2014 Minitab, Inc.

Cmo validar los supuestos?

2014 Minitab, Inc.

Resumen (Obj. 1)
El anlisis de capacidad es sensible a los siguientes
supuestos:
Supuesto de la distribucin de los datos
Estabilidad del proceso

2014 Minitab, Inc.

Qu hacer con datos no-normales?


1. Utilizar una transformacin
2. Encontrar una distribucin no-normal (NN) que modele
de forma apropiada los datos
3. Utilizar un mtodo no-paramtrico
4. Cuando las opciones anteriores no sean factibles,
pregntese por qu es que los datos no siguen una
distribucin normal

2014 Minitab, Inc.

Uso de Transformaciones
Analicemos el tiempo necesario en minutos para
completar una actividad especfica.

2014 Minitab, Inc.

Uso de Transformaciones
La transformacin de Box-Cox
= where [-5, 5]

Nota: Excepto cuando


= 0, Y* = ln(Y)

2014 Minitab, Inc.

Uso de Transformaciones
La transformacin de Johnson
= + ln[ ]

Nota: Asenh(z) =
ln z + 2 + 1

2014 Minitab, Inc.

Estudio con distribuciones alternas


Caso de estudio ciruga
de hernia inguinal.
Cul es la capacidad del
proceso para fabricar una
malla de polipropileno
que soporte una fuerza
mnima de 15 lb?

Fuente:
http://es.wikipedia.org/wiki/Cirug%C
3%ADa_de_la_hernia_inguinal

2014 Minitab, Inc.

Estudio con distribuciones alternas


La distribucin de los
datos no sigue una curva
normal (sesgo positivo).
Los estadsticos de
capacidad son invlidos.

2014 Minitab, Inc.

Estudio con distribuciones alternas

2014 Minitab, Inc.

Estudio con distribuciones alternas


De las posibles distribuciones, seleccionamos la
distribucin loglogstica para ajustar los datos y obtener
una estimacin de la capacidad del proceso.

2014 Minitab, Inc.

Anlisis de capacidad no-paramtrico


Utilice un mtodo no-paramtrico para estimar la
capacidad del proceso.
Ver referencia [3] McCormack et al. [3]. Este mtodo
requiere tamao de muestras ms grandes.
Manejar los datos cual si fueran binarios, y realizar
una prueba de 1 proporcin.

2014 Minitab, Inc.

Anlisis de capacidad no-paramtrico


Ejemplo. Un ingeniero encargado de evaluar el peso
hmedo del producto necesita validar si el proceso es
capaz de satisfacer las necesidades del cliente.
Prueba e IC para una proporcin

Muestra
1

2014 Minitab, Inc.

X
7967

N
7978

Muestra p
0.998621

Lmite
inferior
de 95%
0.997719

Anlisis de capacidad no-paramtrico


Anlisis de peso hmedo usando un anlisis de
capacidad no-paramtrico.

2014 Minitab, Inc.

Resumen (Obj. 2)
Cuando los datos no son normales uno puede utilizar
distintas tcnicas:
Transformacin de Box-Cox o Johnson
Modelar los datos con una distribucin no-normal como por
ejemplo Weibull, Lognormal, o la distribucin del valor ms
extremo.
Con tamaos de muestra ms grandes usted puede utilizar un
enfoque no-paramtrico

Si ninguna de las tcnicas anteriores es de utilidad,


pregntese por qu los datos no son normales.

2014 Minitab, Inc.

Por qu los datos no son normales?


Caso I. La naturaleza del proceso bajo estudio el proceso
se encuentra cerca de una frontera, y los datos que se
generan por lo regular tienen un gran sesgo.
Caso II. Mezcla de distribuciones o unos cuantos valores
extremos el proceso no est bajo control estadstico.

2014 Minitab, Inc.

Por qu los datos no son normales?


Caso III. Tamao de muestras grandes la potencia de las
pruebas de normalidad detectan un sesgo o diferencia
minscula del modelo de normalidad perfecta.
Caso IV. El nmero de dgitos significativos no es suficiente
para diferenciar entre partes, lo cual hace ineficaces a las
pruebas de normalidad clsicas.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso I


Este escenario es el ms sencillo, procedemos a ajustar
los datos a una distribucin no-normal utilizando la
herramienta de identificacin de distribucin (prueba de
bondad de ajuste), o seleccionamos una distribucin
especfica de acuerdo al conocimiento del proceso.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso II


La muestra obtenida para estimar la capacidad del
proceso incluye datos que provienen de distribuciones
distintas.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso II


Una grfica de control es una herramienta efectiva para
detectar que los datos provienen de diferentes
distribuciones.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso II


Qu hacer en situaciones como sta?
Hay que buscar tener un mejor control del proceso.
Implementacin de acciones preventivas y correctivas.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso III


Investiguemos de nueva cuenta el ejemplo de Peso
Hmedo con ms de 7,000 observaciones. Los datos al
parecer siguen una curva normal.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso III


Por qu si los datos se ven normalmente distribuidos la
prueba de normalidad indica lo contrario?
En las palabras de George Box: Todos los modelos son
incorrectos, sin embargo algunos son de utilidad.
Solucin: Utilizar
un enfoque noparamtrico o
utilizar una
muestra
representativa.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso III


Comparacin de los estimadores de porcentaje de
defectos para todos los anlisis realizados con el mismo
conjunto de datos.

2014 Minitab, Inc.

Mtodo

Cpk

Tasa de defectos

FPY

Una proporcin

N/A

0.14%

99.86%

Mtodo no-paramtrico
(percentiles)

1.29* 0.14%

99.86%

Mtodo Normal

1.45

99.9978%

0.0022%

Prueba de Normalidad Fall Caso IV


Baja discriminacin del sistema de medicin.

Redondeo y baja discriminacin


entre las partes genera datos en 3
puntos distintos: 15, 15.5, 16

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


La falta de continuidad en los datos conlleva a la prueba
de Anderson-Darling (AD) a determinar que los datos no
siguen una distribucin normal.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


Para datos redondeados las pruebas de Sesgo (SK),
Curtosis (KT), mnibus (OB) son preferibles.

En cada punto, generamos 5000 muestras


de N=100 y sometimos cada muestra a 4
pruebas de normalidad.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


Consideremos ahora una distribucin con gran sesgo, en
especfico la distribucin exponencial.

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


La prueba de AD al parecer se desempea tan bien
como las pruebas OB y SK, sin embargo la deteccin
viene como consecuencia del redondeo de los datos.

En cada punto, generamos 5000


muestras de 100 observaciones de una
distribucin exponencial (media = 1).

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


Que pasara si los datos provienen de una distribucin
ligeramente sesgada pero no normalmente distribuida?

2014 Minitab, Inc.

Prueba de Normalidad Fall Caso IV


La nica prueba que identifica correctamente que los
datos no son normales es la prueba de AD lo cual lo
hace como consecuencia del redondeo.

2014 Minitab, Inc.

Qu prueba de normalidad utilizar?


Cuando los datos son normales, la prueba de sesgo no
rechaza correctamente la normalidad con el nivel de
significancia esperado.
La prueba de sesgo tiene una buena potencia, y es
menos sensible al grado de redondeo.
Las pruebas de Sesgo y mnibus tienen un
comportamiento similar.

2014 Minitab, Inc.

Resumen (Objetivos 3, 4)
La naturaleza de los datos hace inapropiado el uso de la
distribucin normal.
La falta de controles en un proceso produce muestras de
distribuciones distintas.
Tamaos de muestra grandes pueden incrementar la
sensibilidad de las pruebas de normalidad.
Conforme incrementa el nivel de redondeo, las pruebas
clsicas de normalidad se vuelven menos efectivas.

2014 Minitab, Inc.

Capacidad con Datos Redondeados


Existen unos cuntos enfoques para estimar la
capacidad de un proceso:
1. Enfoque clsico, ignorar la falta de normalidad.
2. Ajustar la desviacin estndar considerando el sesgo
introducido por el equipo de medicin.
3. Manejar los datos como si fuesen censurados o
suspendidos en intervalos.

2014 Minitab, Inc.

Estimacin Clsica de Capacidad


Asumimos que los datos redondeados, denotados como
Y*, siguen una distribucin normal:

Procedemos a calcular Ppk como si los datos fueran


normales.

2014 Minitab, Inc.

Ajuste con Correccin de Sheppard


En el artculo de 1898, Sheppard [5] describe la
estimacin del sesgo en el clculo de la desviacin
estndar cuando los datos han sido redondeados.

w es la unidad ms pequea de su sistema de medicin.

2014 Minitab, Inc.

Anlisis de Censura por Intervalos


Suponga que no sabemos exactamente el verdadero
valor que debimos haber obtenido, pero sabemos el
intervalo en el que caera dicho valor.

Valores Observados
5.1
5.1
5.0
5.2
5.1
5.0

2014 Minitab, Inc.

Converted to

Inicio

Fin

Frecuencia

4.95

5.05

5.05

5.15

5.15

5.25

Anlisis de Censura por Intervalos


Obtenemos los siguientes estimadores:
Anlisis de distribucin, Inicio = Inicio y fin = Fin
Inicio de la variable: Inicio
Frecuencia: Frecuencia

Fin: Fin

Informacin de censura
Valor censurado del intervalo

Conteo
6

Mtodo de clculo: Mxima verosimilitud


Distribucin:
Normal
Clculos del parmetro

Parmetro
Media
Desv.Est.

2014 Minitab, Inc.

Estimacin
5.08345
0.0619204

Error
estndar
0.0278668
0.0218490

IC normal de 95.0%
Inferior Superior
5.02883
5.13807
0.0310086 0.123648

Capacidad de Datos Redondeados

2014 Minitab, Inc.

Capacidad de Datos Redondeados

2014 Minitab, Inc.

Resumen (Obj. 5)
El redondeo de datos produce una falla en las pruebas
clsicas de normalidad. [Rechazan casi con certeza sin
importar la naturaleza de los datos.]
Los datos normales medidos con un sistema de
medicin con baja discriminacin debern ser simtricos;
por lo tanto, hace sentido que las pruebas de sesgo y
mnibus sean de mayor utilidad en este caso.
Otros aspectos no-normales no sern capturados por las
dos pruebas anteriores.

2014 Minitab, Inc.

Resumen (Obj. 5)
El mtodo de mxima verosimilitud (MLE) para datos
por intervalos produce mejores estimadores en general.
Los estimadores MLE son asintticamente insesgados.
[Conforme aumenta el tamao de muestra, el sesgo de
los estimadores se vuelve despreciable]
La simplicidad de la correccin de Sheppard para
estimar s hace de este mtodo uno bastante fcil de
implementar.

2014 Minitab, Inc.

Conclusiones
El objetivo final de un anlisis de capacidad es la
estimacin de la tasa de defectos del proceso.
Cuando el inters de un anlisis estadstico se centre en
la estimacin de los defectos, el supuesto de distribucin
ser extremadamente importante.
Otro supuesto importante es asegurarnos de que el
proceso sea estable y est en control.

2014 Minitab, Inc.

Conclusiones
De los dos supuestos, el de normalidad es el que se
viola ms frecuentemente en la prctica.
El anlisis de capacidad No-Normal (NN) requiere:
Utilizar una transformacin
Encontrar una distribucin alterna que ajuste los datos
Usar un enfoque no-paramtrico el cual requiere un tamao de
muestra grande.

2014 Minitab, Inc.

Conclusiones
Las pruebas clsicas de normalidad (Anderson-Darling,
Kolmogorov-Smirnov, Shapiro-Wilk) tpicamente
rechazan la normalidad cuando los datos tienen poca
discriminacin, sin importar cul es la distribucin real de
los datos.
Cuando utilice un equipo de medicin con baja
discriminacin, utilice distintas pruebas para verificar la
normalidad, como la de Sesgo o la mnibus.

2014 Minitab, Inc.

Conclusiones
Si no existe evidencia de que los datos redondeados
sean no-normales, asuma normalidad.
Utilice el mtodo de censura por intervalos (Mxima
Verosimilitud) para estimar la media y la desviacin
estndar.

2014 Minitab, Inc.

Referencias Bibliogrficas
1.
2.
3.

4.
5.

6.

2014 Minitab, Inc.

Juran, J.M., Godfrey, A.M. Jurans Quality Handbook. 5th edition, McGrawHill. New York, 1999.
Kane, V.E. (1986) Process Capability Indices. Journal of Quality
Technology, 18, 41-52.
McComack, D.W., Harris, I.R., Hurwitz, A.M., and Spagon, P.D. (2000)
Capability Indices for Non-normal data, Quality Engineering. 12(4), 489495.
Schneeweiss, H., Komlos, J., and Ahmad, A.S. (2006) Symmetric and
Asymmetric Rounding. Working paper.
Sheppard, W.F. (1898). On the calculation of the most probable values of
frequency constants for data arranged according to equidistant division of a
scale. Proceedings of the London Mathematical Society. 29, 231-258.
Tricker, A.R. (1984) Effects of Rounding on the Moments of a Probability
Distribution. Journal of the Royal Statistical Society. Series D (The
Statistician). 33(4), 381-390.

APNDICE

2014 Minitab, Inc.

Caso de Estudio
Un fabricante de dispositivos mdicos construye un aparato
de monitoreo de niveles de glucosa en la sangre para
personas diabticas. La lectura es truncada para facilitar el
uso y entendimiento de la misma.
El fabricante mide una solucin estndar con 100 dispositivos
para establecer una base de referencia. Los lmites de
especificacin son [99, 136].

2014 Minitab, Inc.

Datos
122
118
117
120
120
121
122
116
124
117
2014 Minitab, Inc.

121
120
118
117
120
118
119
122
121
118

119
118
119
119
120
117
121
120
118
122

119
120
120
121
122
118
118
117
119
121

123
117
118
120
118
122
118
124
118
121

116
116
118
121
120
119
119
117
121
121

119
120
120
118
117
120
118
120
119
121

120
118
119
117
119
120
121
121
118
119

119
121
120
119
121
120
119
120
122
118

121
120
123
118
117
118
120
115
121
119

Caso de Estudio
La prueba de Anderson-Darling rechaza la normalidad.

2014 Minitab, Inc.

Caso de Estudio
Utilizar una prueba alternativa de Normalidad, como la
prueba de Sesgo.
Nmero Total de Observaciones en Glucosa = 100

Prueba de Sesgo.
Z
0.600407
P-value 0.548235

2014 Minitab, Inc.

Caso de Estudio
Convertir los datos al siguiente formato.
Inicio
114.5
115.5
116.5
117.5
118.5
119.5
120.5
121.5
122.5
123.5

2014 Minitab, Inc.

Fin
115.5
116.5
117.5
118.5
119.5
120.5
121.5
122.5
123.5
124.5

Frecuencia
1
3
10
20
17
21
17
7
2
2

Caso de Estudio
Tratar los datos como censurados por intervalos y
analizarlos con un Anlisis de distribucin paramtrico
para estimar y s.

2014 Minitab, Inc.

Caso de Estudio
Finalmente, con los estimadores de 119.41 para la
media y 1.766 para la desviacin estndar, proceder a
estimar Ppk.


=
,
= 3.13
3
3

2014 Minitab, Inc.