Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Análisis de Capabilidad-Variables PDF
Análisis de Capabilidad-Variables PDF
9/14/2006
Resumen
El procedimiento Análisis de la Capabilidad para datos por variable esta diseñado para
comparar muestras de mediciones recolectadas de un proceso con los límites de especificación
establecidos para esa variable. Una estimación es derivada del porcentaje de artículos que
probablemente están fuera de especificación. También se calcula una variedad de índices de
capacidad que se comparar con el desempeño observado sobre los límites de especificación.
Estos métodos están disponibles para manejar datos de distribuciones normales y no normarles.
strength time
(esfuerzo) (tiempo)
255 0:10
232 0:20
282 0:30
260 0:40
255 0:50
233 1:00
240 1:10
255 1:20
254 1:30
259 1:40
235 1:50
262 2:00
Las botellas requieren tener un esfuerzo a la ruptura entre 200 psi y 300 psi.
Entrada de Datos
Existen dos tipos de selecciones del menú para implementar un análisis de capacidad para datos
por variables, uno para datos individuales y otro para subgrupos.
• Datos: Una o más columnas numéricas. Si más de una columna es ingresada, cada fila del
archivo es asumida para representar un subgrupo con tamaño de subgrupo m igual al numero
de columnas ingresadas. Si solamente una columna es ingresada, entonces el campo Número
o Tamaño de Subgrupo será utilizado para formar los grupos.
• Número o Tamaño de Subgrupo: Si cada conjunto de m filas representa un grupo, ingrese
un solo valor para m. Por ejemplo, ingresar un 5 en el ejemplo anterior implica que los datos
de la fila 1-5 formaran el primer grupo, fila 6-10 formaran el segundo grupo, y así
sucesivamente. Si los tamaños de subgrupos no son iguales, ingrese el nombre de una
columna numérica adicional o una columna de texto conteniendo identificadores por grupo.
El programa puede escanear esta columna y colocar filas secuenciales con códigos
identificadores dentro del mismo grupo.
• LES: Limite de Especificación Superior, si lo hay.
• Nominal: Valor objetivo o nominal opcional para la variable. Si no se ingresa, algunos
índices de la capacidad seguramente no serán calculados.
• LEI: Limite de Especificación Inferior, si lo hay.
• Selección: Selección de un subconjunto de los datos.
Cpk = 1.49
12 Ppk = 1.42
K = 0.09
8
0
200 220 240 260 280 300
strength
3. Una función de densidad de probabilidad de como se ajusta a los datos. Por defecto, se
ajusta una distribución normal, aunque esto se puede cambiar usando Opciones del
Análisis.
Para un proceso “capaz”, los perceptiles estarán dentro de los límites de especificación.
• Numero de Clases: El número de intervalos en los cuales los datos deberán dividirse. Los
intervalos son adyacentes unos de otros con la misma anchura. El número de intervalos sobre
los cuales los datos son agrupados por defecto es determinado por la regla especificada en la
sección de EDA sobre la caja de dialogo de Preferencias desde el menú Edición.
Transformación: ninguna
Distribución: Normal
tamaño de muestra = 100
media = 254.64
desv. est. = 10.6823
• Límites Sigma – Para una distribución normal, esto presenta la media muestral más y menos
un múltiplo de sigma Esto puede cambiarse usando Opciones del Análisis, el rango de
valores cubren 6 veces la estimación de la desviación estándar, lo cual corresponde al
99.73% de una distribución normal. Si otra distribución en lugar de la normal es
seleccionada, la salida muestra Límites Sigma Equivalentes cubriendo el mismo porcentaje de
la población como límites de la normal. Por ejemplo, la salida cuando se ajusta una
distribución Laplace es mostrada abajo:
Note que los intervalos para la distribución Laplace son de 208.5 hasta 301.5, lo cual es
considerablemente más ancho que el intervalo en una normal de 222.6 hasta 286.7. Esto es
por que la distribución Laplace tiene considerablemente colas más largas. Un correcto
análisis depende sobre las propiedades de la distribución seleccionada, lo cual es discutido en
la sección sobre Comparaciones de Distribuciones Alternativas.
© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 6
STATGRAPHICS – Rev. 9/14/2006
• Especificaciones – Esta tabla muestra las especificaciones para los datos y varias estadísticas
importantes:
Observados arriba de Esp. – El porcentaje de la entrada de datos que esta más allá de los
límites de especificación.
Defectos Por Millón – Los Estimados arriba de Esp., expresados en términos del número
de artículos no conformes fuera de cada millón producidos.
Asumiendo una distribución normal para los esfuerzos de las botellas de cristal, se estima que 11
botellas estarán fuera de los límites de especificación por cada millón producido.
Largo plazo y corto plazo – Calcula ambos índices a corto y largo plazo.
Solamente corto plazo – Calcula solamente índices a corto plazo. Son siempre
etiquetados con la letra C, como en Cpk.
Potenciar – Ajustar los datos después de aumentar cada valor a la potencia especificada.
Box-Cox (Optimización) – Ajustar los datos después de aumentar cada valor a una
potencia determinada usando el procedimiento Box-Cox.
Observe que regularmente cuando se selecciona una transformación para el análisis, más
gráficos y tablas desplegaran resultados en la métrica original (no los transformados.
• Umbral Inferior – Para distribuciones definidas por un umbral inferior, el valor del límite
inferior. Esta incluye todas las distribuciones que se indica el número de parámetros después
de su nombre.
• Límites Sigma – La amplitud sigma usada los límites en el gráfico sobre el Gráfico de
Capacidad. Este valor generalmente se fija en 6.
• Parámetros – Presione este botón para especificar los valores para los parámetros.
Normalmente, los parámetros pueden estimarse de los datos. Sin embargo, esta opción
permite fijar los valores de estos parámetros.
Índices de Capacidad
Los índices de capacidad resumen el desempeño de un proceso en comparación con los límites
de especificación. Dependiendo sobre la selección de la caja de dialogo de Opciones del Panel,
STATGRAPHICS puede calcular y presentar un numero grande de índices.
La grafica anterior muestra dos columnas para los índices, una etiquetada “corto plazo” y la otra
“largo plazo”. Los índices a corto plazo son calculado mirando en la variación dentro de
subgrupos (si los datos son agrupados) o entre observaciones consecutivas (si los datos se
recolectan individuales). Los índices a largo plazo son calculados mirando en la variación sobre
el periodo completo de muestreo. Algunos análisis prefieren llamar a la variabilidad a corto
plazo variabilidad “dentro” y a la variabilidad a largo plazo la variabilidad “total”. Nota: la
capacidad a corto plazo solamente es estimado cuando los datos asumen provenir de una
distribución normal.
• Sigma – La distinción clave entre los índices de corto plazo y largo plazo es el método
utilizado para estimar σ, la desviación estándar del proceso. El termino sigma a largo plazo
es estimado de la desviación estándar de la muestra del conjunto de datos completos. Esto
puede incluir variación potencialmente causada por los cambios del proceso durante el
periodo en el cual los datos fueron recolectados, también es una estimación larga que puede
dar una señal de una variación inherente larga o un control del proceso pobre. La estimación
del termino a corto plazo es obtenido de rangos móviles, el cuadrado medio de diferencias
sucesivas, o desviaciones estándar de subgrupos, dependiendo sobre la configuración en la
sección de Capacidad de la caja de dialogo Preferencias, accesible desde el menú Edición.
Puesto que la estimación es tomada de observaciones juntas sobre el tiempo, esta es mucho
menos influenciado por falta de control sobre el proceso. Sin embargo, no necesariamente
puede representar el desempeño actual en el proceso.
• Cp/Pp – Estos son índices de capacidad a dos-colas comparando la distancia entre los limites
de especificación entre k-sigma:
LES − LEI
CP = (1)
kσˆ
Nota: k es normalmente fijado en 6, aunque esto puede cambiarse usando Opciones del
Panel. Muchas compañías requieren que el Cp por lo menos este en 1.33.
kσˆ
C R = 100 % (2)
LES − LEI
LES − LEI
CM = (3)
8σˆ
LES − μˆ
Z LES =
σˆ
(4)
LES − μˆ
C PK (sup erior ) = (7)
(k / 2)σˆ
μˆ − LIE
C PK ( i inf erior ) = (8)
(k / 2)σˆ
Nota: k/2 es normalmente fijado en 3, aunque esto puede cambiarse usando Opciones del
Panel. Muchas compañías requieren que el Cpk por lo menos este en 1.33.
• CCpk – Una versión modificada de Cpk basándose sobre el valor objetivo o nominal T, en
lugar de la estimación de la media del proceso:
⎛ LES − T T − LEI ⎞
CC PK = min⎜⎜ , ⎟⎟ (10)
⎝ (k / 2)σˆ (k / 2)σˆ ⎠
• Cpm – Una versión modificada de Cp mide la variación alrededor del valor objetivo o T en
lugar de la estimación de la media del proceso:
CP (11)
C PM =
1+
(μˆ − T ) 2
σˆ 2
• K – Una medida de la distancia del valor objetivo a la estimación de la media del proceso,
dividida entre la distancia de los límites de especificaciones:
μ̂ − T
K= (12)
LES − LEI
• % arriba de esp. – La estimación del porcentaje de la población más allá de los límites de
especificación, basándose sobre el ajuste de la distribución.
• DPM – La estimación de defectos por millón, basado sobre la estimación del % arriba de
esp.
• Nivel de Calidad Sigma – Un índice del nivel de calidad sigma para el desempeño del
proceso como parte de un proceso Seis Sigma. Si solamente existe un límite de
especificación, el NCL es igual al Z-MIN o (Z-MIN +1.5), dependiendo sobre la
configuración del Cambio Sigma a 1.5 en la caja de dialogo de Opciones del Panel.
Para el esfuerzo de las botellas, note que ambos Cpk y Ppk son mayores a 1.33, lo cual
normalmente podría considerarse como un desempeño aceptable. El valor de K = 0.09 indica que
la estimación de la media del proceso excede el valor T por aproximadamente 9% de la distancia
del valor objetivo al límite de especificación superior.
Puesto que los índices son estadísticos calculados de los datos, hay un margen de error en su
habilidad para estimar la verdadera capacidad del proceso. Para muestras pequeñas, este margen
de error puede ser sustancial. Basándose en la tabla anterior, tenemos declarado una confianza
del 95% de que el verdadero Cpk para el esfuerzo de las botellas se encuentre entre 1.27 y 1.70.
• Límites de Confianza – El tipo de límites que serán desplegados para los índices de
capacidad. Cualquiera de los dos tipo de intervalos de confianza a dos-colas o una-cola serán
calculados.
• Basado en – El múltiplo de sigma k usado para calculas los índices como Cp y Cpk. Este es
generalmente fijado en 6.
Preferencias
La sección Capacidad en la caja de dialogo de Preferencias, accesible desde el menú Edición,
configure varios defectos que afectan la manera en la cual el análisis de capacidad será
desarrollado.
• Incluir – El tipo de índices de capacidad a ser calculados y como deberán de ser etiquetados.
Las opciones son:
Largo plazo y corto plazo – Calcula ambos índices a corto y largo plazo.
Largo plazo solamente (Etiquetado P) – Solamente calcula índices a largo plazo y lo
etiqueta con la letra P, como en Ppk.
Largo plazo solamente (Etiquetado C) – Solamente calcula índices a largo plazo y lo
etiqueta con la letra C, como en Cpk.
Corto plazo solamente – Calcula solamente índices a corto plazo. Son siempre
etiquetados con la letra C, como en Cpk.
• Límites de Confianza – el tipo de límites a ser desplegados para los índices de capacidad.
• Término Sigma a Corto – Datos Agrupados – El método usado para estimar la desviación
estándar del proceso para datos agrupados. Las opciones son:
Por Rango Promedio – Estima sigma por ponderaciones promedio de los rangos de
subgrupos.
• Aplicar corrección de sesgo para s – Si es activada, las correcciones son aplicadas para
estimar σ removiendo cualquier sesgo. Las formulas afectadas incluyen las estimaciones de
grupos basadas sobre el promedio y s combinada, y la estimación de individuos basada sobre
la media SSD. Esta configuración también afecta la estimación de sigma a largo plazo.
• Índices para Datos no Normales – Cuando construimos índices de capacidad para datos con
distribuciones no normales, los controles del índice están basados en los valores Z o entre la
distancia de los perceptiles. Si selecciona Usar Valor Z Correspondiente, entonces la relación
entre los índices de capacidad y el porcentaje de la población a través de los límites de
especificación es el mismo para todas las distribuciones. Si selecciona Usar Distancia Entre
Perceptiles es seleccionado, entonces la definición de los índices de capacidad así como los
cocientes de las distancias se conserva, pero un valor Z igual a 4 se compara para diferentes
porcentajes de los artículos no conformes para diferentes distribuciones.
• Límites Sigma para Graficar – Define la distancia entre los límites de tolerancia mostrados
sobre el gráfico de capacidad.
• Límites Sigma para Índices – Define el número de desviaciones estándar usando como
denominador Cp e índices de capacidad relacionados. Este valor generalmente de fija en 6.
Prueba de Normalidad
La estimación de la capacidad del proceso presentada anteriormente al altamente dependiente de
la distribución asumida de las observaciones. Por defecto, se asume generalmente que los datos
siguen una distribución normal. El panel Prueba para Normalidad desarrolla una o más pruebas
para determinar cuando o no es razonable esta asunción. Para cada prueba, las hipótesis de
interés son:
• Hipótesis Nula: Los datos son muestras independientes de una distribución normal.
• Hipótesis Alternativa: Los datos no son muestras independientes de una distribución
normal.
La prueba es ejecutada usando la selección de Opciones del Panel. Cada prueba es desplegada
con la el estadístico de prueba asociado y el Valor-P. Un Valor-P pequeño (arriba de 0.05 si esta
operando un nivel de significancia del 5%) rechaza la hipótesis nula y por lo tanto rechaza la
distribución normal. En la tabla anterior, los valores P son aceptables arriba de 0.05, no existe
significancia estadística de la no-normalidad de los datos.
Para una descripción detallada de las pruebas, vea la documentación detallada de Ajustando una
Distribución (Datos sin Censura).
Incluir – Seleccione las pruebas que serán incluidas a la salida. Los pruebas por defecto son
definidas sobre la sección de Ajuste de Distribución de la caja de dialogo Preferencias accesible
desde el menú Edición.
Gráfico de Probabilidad
El Gráfico de Probabilidad es otro método por el cual podemos juzgar si o no la distribución
actual seleccionado describe adecuadamente a los datos.
Gráfica de Probabilidad
300
Media=254.64
Desv. Est.=10.6823
Normal Distribución
280
260
240
220
220 240 260 280 300
strength
El gráfico muestra los valores de los datos, ordenados de menor a mayor, graficado contra los
perceptiles equivalentes de la distribución ajustada. Si el ajuste de la distribución es un modelo
razonable para los datos, caerán aproximadamente a lo largo de una línea recta. Para el esfuerzo
de las botellas, la distribución normal hace un trabajo razonable.
• Dirección: El eje sobre el cual los perceptiles de la distribución ajustada será graficado.
• Línea Estimada: Si Activa esta caja incluye una línea diagonal sobre el gráfico.
La tabla muestra:
Las distribuciones son ordenadas de la mejor a la peor de acuerdo a una columna de la prueba de
bondad-del-ajuste. Esa columna es seleccionada usando el botón Pruebas sobre la caja de
dialogo de Opciones del Panel. La tabla anterior muestra las distribuciones ordenadas de acuerdo
al estadístico Anderson-Darling A2. De acuerdo a las estadísticas, la distribución Laplace tiene el
mejor ajuste.
• Ordenar por – Seleccione una de las estadísticas a usar para ordenar las distribuciones
del mejor al peor.
20 Cp = 1.07
Pp = 1.04
frecuencia
15 Cpk = 1.01
Ppk = 0.98
10 K = 0.18
0
200 220 240 260 280 300 320
strength
Las líneas verticales ahora son colocadas en posiciones que cubren el 99.73% del centro de la
distribución Laplace, en lugar de más y menos 3 sigma. Esto resulta ser un rango mucho más
grande que antes.
Pueden realizarse otras comparaciones interesantes entre las distribuciones como se muestra en
la tabla:
Distribución Distribución
Normal Laplace
DPM – A Largo Plazo 11.03 2088.47
Ppk 1.415 0.981
Nivel de Calidad Sigma 5.74 4.36
Prueba de Bondad-del-Ajuste
Si alguna distribución a excepción de la normal se ajusta a los datos, la adecuación como un
modelo a los datos deberá probarse usando la Prueba de Falta-de-Ajuste. Hasta 7 diferentes
pruebas podrán desarrollarse. Para todas las pruebas, las hipótesis de interés son:
Prueba de Kolmogorov-Smirnov
Laplace Distribución
DPLUS 0.0499018
DMINUS 0.05
DN 0.05
Valor-P 0.963945
Las pruebas deberán ejecutarse usando la selección de Opciones del Panel. Dos pruebas
comunes se muestran abajo. En cado caso, si el Valor-P es grande (mayor o igual que 0.05 si esta
operando a un nivel de significancia del 5%), entonces la distribución es un modelo razonable
para los datos. Para una descripción más detallada de las pruebas, vea la documentación
Ajustando una Distribución (Datos sin Censura).
• Incluir: Seleccione una o más pruebas para desarrollar. Para la prueba Chi-Cuadrada,
seleccione usar clases equiprobables para agrupar los datos en clases con la misma
frecuencia esperada. Si esta opción no esta marcada, las clases serán creadas para emparejar
el Gráfico de Capacidad.
1. Un índice llamado Cp(q) basándose sobre los cuantiles de una curva para emparejar
el sesgo y la curtosis de los datos.
2. Un índice llamado Cpc que se basa en la distancia promedio absoluta de los valores
de los datos con respecto al valor objetivo.
Índice Estimado
Pp(q) 1.41825
Ppk(q) 1.36902
Ppk (superior)(q) 1.36902
Ppk (inferior)(q) 1.46155
K(q) 0.0966624
NOTA: estos índices están basados en las distancias entre los límites equivalentes 6-sigma y corresponden al desempeño a largo
plazo.
La capacidad estimada es un poco peor que con los índices estándar, que esta en línea con las
colas ligeramente largas. Sin embargo, el efecto no es tan dramático si una distribución
Laplace fuera seleccionada.
π
∑x
i =1
i −T
k
2 n
donde k es comúnmente fijado en 6. Una propiedad interesante de este estadístico es que esta
basado sobre la distancia promedio absoluta de las observaciones con su valor objetivo T.
Gráfico de Tolerancia
El grafico de tolerancia grafica los datos por filas en orden con líneas horizontales indicando el
valor objetivo y los límites de especificación.
Carta de Tolerancia
300 300.00
280
260
strength
250.00
240
220
200 200.00
0 20 40 60 80 100
Observación
• Lugares Decimales para los Límites – Número de lugares decimales para desplegar los
valores a la derecha del gráfico.
• Color de Zona: Activar esta caja para desplegar las zonas verde, amarillo y rojo.
x ± Ks (14)
Especificaciones
LSE = 300.0
Nom = 250.0
LIE = 200.0
Por ejemplo, la tabla anterior declara que con una confianza del 95% el 99% de todas las botellas
producidas pueden tener un esfuerzo a la ruptura entre 207 y 301. Consecuentemente,
estableciendo especificaciones basadas en estos límites encontraremos una tasa de defectos no
mayor a una 1 botella fuera por cada 100,000.
• Nivel de Confianza – Especifica el nivel de confianza para los límites de tolerancia, e.j.,
100(1-α)%.
Especificaciones
LSE = 300.0
Nom = 250.0
LIE = 200.0
Por ejemplo, la tabla anterior toma los valores más extremos del esfuerzo e indica que con una
confianza del 95% por lo menos el 95.3433% de todas las botellas tendrían esfuerzo a la ruptura
entre 225 psi y 282 psi.
• Profundidad del Intervalo – Específica el valor k utilizado para seleccionar las estadísticas
de orden sobre las cuales se basan los límites. En la creación del intervalo, el procedimiento
usa los valores k-ésimo más pequeño y más grande.
Gráfico X o X-barra
Un grafico X estándar es creado si los datos son individuos, mientras un grafico X-Barra es
creado para datos agrupados.
Carta X
300
285.13
280
strength
260
254.64
240
224.15
220
0 20 40 60 80 100
Observación
Los puntos fuera-de-control serán señalados por una señal roja, así como las violaciones de las
reglas de corridas si en las preferencias de Gráficos Control están incluidas las violaciones a las
© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 26
STATGRAPHICS – Rev. 9/14/2006
reglas sobre los gráficos de control. Cualquier señal de fuera-de-control debe ser evaluada
cuidadosamente puesto que puede impactar en la estimación de la capacidad del proceso.
• Lugares Decimales para los Límites – Número de lugares decimales para desplegar los
valores a la derecha del gráfico.
• Color de Zona: Activar esta caja para desplegar las zonas verde, amarillo y rojo.
Gráfico MR(2) o R
Un gráfico MR(2) es creado si los datos son individuos, mientras que un gráfico R será creado
para los datos agrupados.
Carta de Rangos
50
40
37.46
30
MR(2)
20
10 11.46
0 0.00
0 20 40 60 80 100
Observación
• Lugares Decimales para los Límites – Número de lugares decimales para desplegar los
valores a la derecha del gráfico.
• Color de Zona: Activar esta caja para desplegar las zonas verde, amarillo y rojo.
Cálculos
n 2
∑ (x i − x)
σˆ = i =1 (15)
n −1
n 2
∑ (x
i =1
i − x)
n −1
σˆ = (16)
c 4 (n)
R
σˆ = (17)
d 2 ( 2)
De la mediana MR:
~
R
σˆ = (18)
d 4 ( 2)
∑ (x − x i −1 )
2
i
1
σˆ = i=2 (19)
2 n −1
∑ (x − x i −1 )
2
i
1 i =2
2 n −1
σˆ = (20)
c ′4 (n)
k ⎛ f jRj ⎞
∑ ⎜⎜ d (n )⎟⎟
⎝
j =1 ⎠ (21)
σˆ =
2 j
k
∑f j =1
j
donde
d 22 (n j )
fi = (22)
d 32 (n j )
∑n
j =1
j sj
σˆ = (23)
k
∑n j =1
j
k ⎛ f jsj ⎞
∑ ⎜⎜ c (n )⎟⎟
⎝
j =1 ⎠ (24)
σˆ =
4 j
k
∑h j =1
j
donde
c 42 (n j )
hj = (25)
1 − c 42 (n j )
∑ (n − 1)s 2j
k
j
j =1 (26)
σˆ =
∑ (n − 1)
k
j
j =1
∑ (n − 1)s 2j
k
j
j =1 (27)
σˆ =
c 4 (d )∑ (n j − 1)
m
j =1
donde
d = 1 + ∑ (n j − 1)
k
(28)
j =1
χ 12−α / 2, n −1 χ α2 / 2, n −1
Cˆ P ≤ C P ≤ Cˆ P (29)
n −1 n −1
⎡ 1 1 ⎤ ⎡ 1 1 ⎤
Cˆ PK ⎢1 − Z α / 2 + ⎥ ≤ C ≤ ˆ ⎢1 + Z
C + ⎥ (30)
2(n − 1) ⎥⎦ 2(n − 1) ⎥⎦
PK PK α / 2
⎢⎣ 9nCˆ PK
2
⎢⎣ 9nCˆ PK
2
Cˆ PC Cˆ PC
≤ C PC ≤ (31)
1 + t α / 2, n −1 s C / c n[ ( )] [ ( )]
1 − t α / 2, n −1 s C / c n
donde
n
∑x −T
, s C2 = 1 ⎛⎜ ∑ x i − T 2 − nc 2 ⎞⎟
i n
i =1
c= (32)
n n − 1 ⎝ i =1 ⎠
donde
ν=
(n + λ )2 , ⎛ μˆ − T ⎞
2
λ = n⎜ ⎟ (34)
n + 2λ ⎝ σˆ ⎠