Análisis de Capabilidad-Variables PDF

STATGRAPHICS – Rev.
9/14/2006
Análisis de Capabilidad (Variables)
Resumen
El procedimiento Análisis de la Capabilidad para datos por variable esta diseñado para
comparar muestras de mediciones recolectadas de un proceso con los límites de especificación
establecidos para esa variable. Una estimación es derivada del porcentaje de artículos que
probablemente están fuera de especificación. También se calcula una variedad de índices de
capacidad que se comparar con el desempeño observado sobre los límites de especificación.
Estos métodos están disponibles para manejar datos de distribuciones normales y no normarles.
Ejemplo StatFolio: capability.sgp
Datos del Ejemplo:

El archivo bottles.sf3 contiene mediciones del esfuerzo a la ruptura de n = 100 botellas de cristal,
similar a la base de datos contenida en Montgomery (2005). Cada fila consiste de una muestra
probada a intervalos de tiempo en 10 minutos. La tabla de abajo presenta una lista parcial de los
datos del archivo:
strength time
(esfuerzo) (tiempo)
255 0:10
232 0:20
282 0:30
260 0:40
255 0:50
233 1:00
240 1:10
255 1:20
254 1:30
259 1:40
235 1:50
262 2:00
Las botellas requieren tener un esfuerzo a la ruptura entre 200 psi y 300 psi.
Entrada de Datos
Existen dos tipos de selecciones del menú para implementar un análisis de capacidad para datos
por variables, uno para datos individuales y otro para subgrupos.
Caso #1: Individuales

Los datos para analizar consisten de una sola columna numérica que contiene n observaciones.
Se asumen que los datos fueron tomados una vez en el tiempo.
© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 1

STATGRAPHICS – Rev. 9/14/2006
• Datos: Columna numérica que contiene los datos a ser analizados.
• LES: Limite de Especificación Superior, si lo hay.
• Nominal: Valor objetivo o nominal opcional para la variable. Si no se ingresa, algunos

índices de la capacidad seguramente no serán calculados.
• LEI: Limite de Especificación Inferior, si lo hay.
• Selección: Selección de un subconjunto de los datos.
Al menos uno de los límites de especificación deberá ingresarse.
Caso #2: Datos Agrupados

Los datos a ser analizados consisten de una o más columnas numéricas. Se asumen que los datos
fueron tomados en subgrupos, en un orden secuencial por filas.

• Datos: Una o más columnas numéricas. Si más de una columna es ingresada, cada fila del
archivo es asumida para representar un subgrupo con tamaño de subgrupo m igual al numero
de columnas ingresadas. Si solamente una columna es ingresada, entonces el campo Número
o Tamaño de Subgrupo será utilizado para formar los grupos.
• Número o Tamaño de Subgrupo: Si cada conjunto de m filas representa un grupo, ingrese
un solo valor para m. Por ejemplo, ingresar un 5 en el ejemplo anterior implica que los datos
de la fila 1-5 formaran el primer grupo, fila 6-10 formaran el segundo grupo, y así
sucesivamente. Si los tamaños de subgrupos no son iguales, ingrese el nombre de una
columna numérica adicional o una columna de texto conteniendo identificadores por grupo.
El programa puede escanear esta columna y colocar filas secuenciales con códigos
identificadores dentro del mismo grupo.
• LES: Limite de Especificación Superior, si lo hay.
• Nominal: Valor objetivo o nominal opcional para la variable. Si no se ingresa, algunos
índices de la capacidad seguramente no serán calculados.
• LEI: Limite de Especificación Inferior, si lo hay.
• Selección: Selección de un subconjunto de los datos.
Al menos uno de los límites de especificación deberá ingresarse.

Gráfico de la Capacidad
La mejor pintura de los análisis desarrollados por este procedimiento se encuentra por el Gráfico
de la Capacidad.
Capacidad de Proceso para strength

Normal
LIE = 200.0, Nominal = 250.0, LSE = 300.0
Media=254.64
24 Desv. Est.=10.6823
20
Cp = 1.64
16 Pp = 1.56
frecuencia
Cpk = 1.49
12 Ppk = 1.42
K = 0.09
8
0
200 220 240 260 280 300
strength
El Gráfico de la Capacidad muestra:
1. Un Histograma de frecuencias para las muestra de los datos.
2. Líneas verticales largas en los límites de especificación y valor nominal.
3. Una función de densidad de probabilidad de como se ajusta a los datos. Por defecto, se
ajusta una distribución normal, aunque esto se puede cambiar usando Opciones del
Análisis.
4. Líneas verticales cortas en los perceptiles especificados de la distribución estimada. Por

defecto, los perceptiles están posicionados para cubrir el 99.73% de la distribución
ajustada, para una distribución normal se cubre un intervalo de 6 sigma centrada en la
media muestral.
Para un proceso “capaz”, los perceptiles estarán dentro de los límites de especificación.

Opciones del Panel
• Numero de Clases: El número de intervalos en los cuales los datos deberán dividirse. Los
intervalos son adyacentes unos de otros con la misma anchura. El número de intervalos sobre
los cuales los datos son agrupados por defecto es determinado por la regla especificada en la
sección de EDA sobre la caja de dialogo de Preferencias desde el menú Edición.
• Límite Inferior: Límite inferior para el primer intervalo.
• Límite Superior: Límite superior para el último intervalo.
• Mantener: Mantiene el numero de intervalos y límites seleccionados incluso si los datos

fuente cambian. Por defecto, el número de clases y los límites son recalculados siempre que
los datos cambien. Esto es necesario para presentar todas las observaciones incluso si alguno
de los datos actualizados caen más allá de los límites originales.

Resumen del Análisis

El Resumen del Análisis resume la entrada de datos y presenta diferentes resultados importantes.
Análisis de Capabilidad de Proceso(Individuales) - strength

Datos/Variable: strength
Transformación: ninguna
Distribución: Normal
tamaño de muestra = 100
media = 254.64
desv. est. = 10.6823
6.0 Límites Sigma

+3.0 sigma = 286.687
media = 254.64
-3.0 sigma = 222.593
Observados Estimados Defectos

Especificaciones Fuera Especs. Valor-Z Fuera Especs. Por Millón
LSE = 300.0 0.000000% 4.25 0.001087% 10.87
Nominal = 250.0 -0.43
LIE = 200.0 0.000000% -5.12 0.000016% 0.16
Total 0.000000% 0.001103% 11.03
• Variables de los Datos – La columna o columnas que contienen los datos.
• Transformación – Si una selección fue hecha en el campo Transformación de Datos sobre

la caja de dialogo Opciones del Análisis, la manera en la cual los datos fueron transformados
es resumida.
• Distribución – La distribución asumida para los datos y la estimación o parámetros

especificados-por-usuario. Por defecto, una distribución normal es asumida esto se cambia
usando Opciones del Análisis. Las distribuciones son ajustadas usando la estimación por
máxima verosimilitud (MLE) sobre los datos combinados de todos los subgrupos.
• Límites Sigma – Para una distribución normal, esto presenta la media muestral más y menos
un múltiplo de sigma Esto puede cambiarse usando Opciones del Análisis, el rango de
valores cubren 6 veces la estimación de la desviación estándar, lo cual corresponde al
99.73% de una distribución normal. Si otra distribución en lugar de la normal es
seleccionada, la salida muestra Límites Sigma Equivalentes cubriendo el mismo porcentaje de
la población como límites de la normal. Por ejemplo, la salida cuando se ajusta una
distribución Laplace es mostrada abajo:
Equivalente 6.0 Límites Sigma

99.865 percentil = 301.488
mediana = 255.0
0.134996 percentile = 208.512
Note que los intervalos para la distribución Laplace son de 208.5 hasta 301.5, lo cual es
considerablemente más ancho que el intervalo en una normal de 222.6 hasta 286.7. Esto es
por que la distribución Laplace tiene considerablemente colas más largas. Un correcto
análisis depende sobre las propiedades de la distribución seleccionada, lo cual es discutido en
la sección sobre Comparaciones de Distribuciones Alternativas.
• Especificaciones – Esta tabla muestra las especificaciones para los datos y varias estadísticas
importantes:
Observados arriba de Esp. – El porcentaje de la entrada de datos que esta más allá de los
límites de especificación.
Valor Z – Para una distribución normal, es la distancia de los límites de especificación a

la media muestral, dividida por la desviación estándar muestral. Para distribuciones no
normales, un equivalente al valor Z se presenta basándose sobre el porcentaje de la
distribución ajustada más allá del límite de especificación. Consecuentemente, un valor Z
de 3, corresponde a un limite de especificación que esta a 3 desviaciones estándar lejos de
la media en el caso de una distribución normal, corresponde exactamente al 0.14% más
allá del limite de especificación de la distribución que sea seleccionada.
Estimados arriba de Esp. – El porcentaje de la distribución ajustada más allá de los

límites de especificación. Esto estima el porcentaje de los productos no conforme que es
producido.
Defectos Por Millón – Los Estimados arriba de Esp., expresados en términos del número
de artículos no conformes fuera de cada millón producidos.
Asumiendo una distribución normal para los esfuerzos de las botellas de cristal, se estima que 11
botellas estarán fuera de los límites de especificación por cada millón producido.
Opciones del Análisis

• Distribución – La distribución asumida para los datos. Seleccione Comparación de
Distribuciones Alternativas para comparar la prueba de bondad del ajuste para varias
distribuciones.
• Incluir – El tipo de índices de capacidad para calcularse y presentarse sobre el Gráfico de

Capacidad. Las opciones son:
Largo plazo y corto plazo – Calcula ambos índices a corto y largo plazo.
Solamente largo plazo (Etiquetado P) – Calcula solamente índices a largo plazo y lo

etiqueta con la letra P, como en Ppk.
Solamente largo plazo (Etiquetado C) – Calcula solamente índices a largo plazo y lo

etiqueta con la letra C, como en Cpk.
Solamente corto plazo – Calcula solamente índices a corto plazo. Son siempre
etiquetados con la letra C, como en Cpk.
• Transformación de los Datos – El tipo de transformación aplicada a los datos antes de

ajustar la distribución seleccionada. A menudo, si la distribución normal no se ajusta
adecuadamente a los datos, podemos ajustar alguna transformación a los datos. Las opciones
son:
Ninguno – Ajustar los datos originales.
Logaritmo – Ajustar el logaritmo natural de los datos.
Potenciar – Ajustar los datos después de aumentar cada valor a la potencia especificada.
Box-Cox (Optimización) – Ajustar los datos después de aumentar cada valor a una
potencia determinada usando el procedimiento Box-Cox.
Observe que regularmente cuando se selecciona una transformación para el análisis, más
gráficos y tablas desplegaran resultados en la métrica original (no los transformados.
• Umbral Inferior – Para distribuciones definidas por un umbral inferior, el valor del límite
inferior. Esta incluye todas las distribuciones que se indica el número de parámetros después
de su nombre.
• Límites Sigma – La amplitud sigma usada los límites en el gráfico sobre el Gráfico de
Capacidad. Este valor generalmente se fija en 6.
• Parámetros – Presione este botón para especificar los valores para los parámetros.
Normalmente, los parámetros pueden estimarse de los datos. Sin embargo, esta opción
permite fijar los valores de estos parámetros.

Índices de Capacidad
Los índices de capacidad resumen el desempeño de un proceso en comparación con los límites
de especificación. Dependiendo sobre la selección de la caja de dialogo de Opciones del Panel,
STATGRAPHICS puede calcular y presentar un numero grande de índices.
Índices de Capabilidad para strength

Especificaciones
LSE = 300.0
Nom = 250.0
LIE = 200.0
Corto Plazo Largo Plazo

Capabilidad Desempeño
Sigma 10.1637 10.6823
Cp/Pp 1.63982 1.56021
CR/PR 60.9822 64.0938
CM/PM 1.22987 1.17016
Zlse 4.46294 4.24628
Zlie 5.376 5.115
Zmin 4.46294 4.24628
Cpk/Ppk 1.48765 1.41543
Cpk/Ppk (superior) 1.48765 1.41543
Cpk/Ppk (inferior) 1.792 1.705
CCpk 1.63982
Cpm 1.4299
K 0.0928
% fuera de especs. 0.000408377 0.0011032
DPM 4.08377 11.032
Nivel de Calidad Sigma 5.96075 5.74292
Con base en límites 6.0 sigma. La sigma de corto plazo se estimó a partir del rango móvil promedio. El Nivel de Calidad Sigma
incluye un drift de 1.5 sigma en la media.
La grafica anterior muestra dos columnas para los índices, una etiquetada “corto plazo” y la otra
“largo plazo”. Los índices a corto plazo son calculado mirando en la variación dentro de
subgrupos (si los datos son agrupados) o entre observaciones consecutivas (si los datos se
recolectan individuales). Los índices a largo plazo son calculados mirando en la variación sobre
el periodo completo de muestreo. Algunos análisis prefieren llamar a la variabilidad a corto
plazo variabilidad “dentro” y a la variabilidad a largo plazo la variabilidad “total”. Nota: la
capacidad a corto plazo solamente es estimado cuando los datos asumen provenir de una
distribución normal.

Los valores de la tabla de describen abajo.
• Sigma – La distinción clave entre los índices de corto plazo y largo plazo es el método
utilizado para estimar σ, la desviación estándar del proceso. El termino sigma a largo plazo
es estimado de la desviación estándar de la muestra del conjunto de datos completos. Esto
puede incluir variación potencialmente causada por los cambios del proceso durante el
periodo en el cual los datos fueron recolectados, también es una estimación larga que puede
dar una señal de una variación inherente larga o un control del proceso pobre. La estimación
del termino a corto plazo es obtenido de rangos móviles, el cuadrado medio de diferencias
sucesivas, o desviaciones estándar de subgrupos, dependiendo sobre la configuración en la
sección de Capacidad de la caja de dialogo Preferencias, accesible desde el menú Edición.
Puesto que la estimación es tomada de observaciones juntas sobre el tiempo, esta es mucho
menos influenciado por falta de control sobre el proceso. Sin embargo, no necesariamente
puede representar el desempeño actual en el proceso.
• Cp/Pp – Estos son índices de capacidad a dos-colas comparando la distancia entre los limites
de especificación entre k-sigma:
LES − LEI
CP = (1)
kσˆ
Nota: k es normalmente fijado en 6, aunque esto puede cambiarse usando Opciones del
Panel. Muchas compañías requieren que el Cp por lo menos este en 1.33.
• CR/PR – La razón de capacidad, definida por:
kσˆ
C R = 100 % (2)
LES − LEI
Esta razón es el reciproco de Cp.
• CM/PM – El índice de capacidad de la maquina, definido por:
LES − LEI
CM = (3)
8σˆ
El denominador de este índice es fijado en 8-sigma.
• Z-LES – Un valor Z para el límite de especificación superior:
LES − μˆ
Z LES =
σˆ
(4)
• Z-LEI – Un valor Z para el límite de especificación inferior:

μˆ − LSL
Z LSL =
σˆ
(5)
• Z-MIN – El mínimo de los valores Z calculados:
Z MIN = min (Z LEI , Z LES ) (6)
Un valor Z de 4 corresponde a un Cpk de 1.33 si los datos provienen de una distribución

normal.
• Cpk(superior) – Un índice de capacidad basado en una-cola sobre el límite de

especificación superior:
LES − μˆ
C PK (sup erior ) = (7)
(k / 2)σˆ
• Cpk(inferior) – Un índice de capacidad basado en una-cola sobre el límite de especificación

inferior:
μˆ − LIE
C PK ( i inf erior ) = (8)
(k / 2)σˆ
• Cpk – El mínimo de los dos índices de una-cola:
C PK = min (C PK (sup erior ) , C PK (inf erior ) ) (9)
Nota: k/2 es normalmente fijado en 3, aunque esto puede cambiarse usando Opciones del
Panel. Muchas compañías requieren que el Cpk por lo menos este en 1.33.
• CCpk – Una versión modificada de Cpk basándose sobre el valor objetivo o nominal T, en
lugar de la estimación de la media del proceso:
⎛ LES − T T − LEI ⎞
CC PK = min⎜⎜ , ⎟⎟ (10)
⎝ (k / 2)σˆ (k / 2)σˆ ⎠
Si el valor nominal no es especificado, entonces T será fijado en la mitad de los límites de

especificación inferior y superior.
• Cpm – Una versión modificada de Cp mide la variación alrededor del valor objetivo o T en
lugar de la estimación de la media del proceso:
CP (11)
C PM =
1+
(μˆ − T ) 2
σˆ 2

Cpm puede ser sustancialmente menor que Cp si el proceso es significativamente no
centrado.
• K – Una medida de la distancia del valor objetivo a la estimación de la media del proceso,
dividida entre la distancia de los límites de especificaciones:
μ̂ − T
K= (12)
LES − LEI
• % arriba de esp. – La estimación del porcentaje de la población más allá de los límites de
especificación, basándose sobre el ajuste de la distribución.
• DPM – La estimación de defectos por millón, basado sobre la estimación del % arriba de
esp.
• Nivel de Calidad Sigma – Un índice del nivel de calidad sigma para el desempeño del
proceso como parte de un proceso Seis Sigma. Si solamente existe un límite de
especificación, el NCL es igual al Z-MIN o (Z-MIN +1.5), dependiendo sobre la
configuración del Cambio Sigma a 1.5 en la caja de dialogo de Opciones del Panel.
Para el esfuerzo de las botellas, note que ambos Cpk y Ppk son mayores a 1.33, lo cual
normalmente podría considerarse como un desempeño aceptable. El valor de K = 0.09 indica que
la estimación de la media del proceso excede el valor T por aproximadamente 9% de la distancia
del valor objetivo al límite de especificación superior.
STATGRAPHICS también calcula intervalos de confianza o límites para distintos índices de

capacidad:
Intervalos de confianza del 95.0% Intervalos de Confianza

Índice Límite Inferior Límite Superior
Cp 1.4116 1.86767
Pp 1.34307 1.77699
Cpk 1.27038 1.70492
Ppk 1.20773 1.62312
Cpm 1.23435 1.6251
Puesto que los índices son estadísticos calculados de los datos, hay un margen de error en su
habilidad para estimar la verdadera capacidad del proceso. Para muestras pequeñas, este margen
de error puede ser sustancial. Basándose en la tabla anterior, tenemos declarado una confianza
del 95% de que el verdadero Cpk para el esfuerzo de las botellas se encuentre entre 1.27 y 1.70.

Opciones del Panel
• Desplegar – Seleccione el índice a desplegar. La selección sobre la caja de dialogo afecta a

la tabulación de los índices así como al Gráfico de Capacidad. Para cambiar la selección por
defecto, use la sección Capacidad sobre la caja de dialogo Preferencias accesible desde el
menú Edición.
• Límites de Confianza – El tipo de límites que serán desplegados para los índices de
capacidad. Cualquiera de los dos tipo de intervalos de confianza a dos-colas o una-cola serán
calculados.
• Basado en – El múltiplo de sigma k usado para calculas los índices como Cp y Cpk. Este es
generalmente fijado en 6.
• Nivel de Confianza – El nivel de confianza determinado para los intervalos de confianza.
Preferencias
La sección Capacidad en la caja de dialogo de Preferencias, accesible desde el menú Edición,
configure varios defectos que afectan la manera en la cual el análisis de capacidad será
desarrollado.

• Desplegar – Los índices desplegados por defecto en los procedimientos de análisis de

capacidad.
• Incluir – El tipo de índices de capacidad a ser calculados y como deberán de ser etiquetados.
Las opciones son:
Largo plazo y corto plazo – Calcula ambos índices a corto y largo plazo.
Largo plazo solamente (Etiquetado P) – Solamente calcula índices a largo plazo y lo
etiqueta con la letra P, como en Ppk.
Largo plazo solamente (Etiquetado C) – Solamente calcula índices a largo plazo y lo
etiqueta con la letra C, como en Cpk.
Corto plazo solamente – Calcula solamente índices a corto plazo. Son siempre
etiquetados con la letra C, como en Cpk.
• Límites de Confianza – el tipo de límites a ser desplegados para los índices de capacidad.
• Término Sigma a Corto – Datos Agrupados – El método usado para estimar la desviación
estándar del proceso para datos agrupados. Las opciones son:
Por Rango Promedio – Estima sigma por ponderaciones promedio de los rangos de
subgrupos.

Por Promedio s – Estima sigma por ponderaciones promedio de la desviaciones estándar
de los subgrupos.
Por s combinada – Estima sigma por el cuadrado medio del error dentro de subgrupos de
un análisis de varianza.
• Término Sigma a Corto – Individuales – El método usado para estimar la desviación

estándar del proceso para datos no agrupados. Las opciones son:
Por Promedio MR – Estima sigma por el promedio de rangos móviles de observaciones

consecutivas.
Por Mediana MR – Estima sigma por la mediana de rangos móviles de observaciones
consecutivas.
Por Media SSD – Estima sigma por el cuadrado de diferencias (el cuadrado de
diferencias entre observaciones consecutivas).
• Aplicar corrección de sesgo para s – Si es activada, las correcciones son aplicadas para
estimar σ removiendo cualquier sesgo. Las formulas afectadas incluyen las estimaciones de
grupos basadas sobre el promedio y s combinada, y la estimación de individuos basada sobre
la media SSD. Esta configuración también afecta la estimación de sigma a largo plazo.
• Índices para Datos no Normales – Cuando construimos índices de capacidad para datos con
distribuciones no normales, los controles del índice están basados en los valores Z o entre la
distancia de los perceptiles. Si selecciona Usar Valor Z Correspondiente, entonces la relación
entre los índices de capacidad y el porcentaje de la población a través de los límites de
especificación es el mismo para todas las distribuciones. Si selecciona Usar Distancia Entre
Perceptiles es seleccionado, entonces la definición de los índices de capacidad así como los
cocientes de las distancias se conserva, pero un valor Z igual a 4 se compara para diferentes
porcentajes de los artículos no conformes para diferentes distribuciones.
• Límites Sigma para Graficar – Define la distancia entre los límites de tolerancia mostrados
sobre el gráfico de capacidad.
• Límites Sigma para Índices – Define el número de desviaciones estándar usando como
denominador Cp e índices de capacidad relacionados. Este valor generalmente de fija en 6.
Prueba de Normalidad
La estimación de la capacidad del proceso presentada anteriormente al altamente dependiente de
la distribución asumida de las observaciones. Por defecto, se asume generalmente que los datos
siguen una distribución normal. El panel Prueba para Normalidad desarrolla una o más pruebas
para determinar cuando o no es razonable esta asunción. Para cada prueba, las hipótesis de
interés son:
• Hipótesis Nula: Los datos son muestras independientes de una distribución normal.
• Hipótesis Alternativa: Los datos no son muestras independientes de una distribución
normal.

Pruebas de Normalidad para strength

Prueba Estadístico Valor-P
Estadístico W de Shapiro-Wilk 0.97781 0.416181
Puntuación Z para asimetría 0.399024 0.689872
Puntuación Z para curtosis 1.18663 0.235371
La prueba es ejecutada usando la selección de Opciones del Panel. Cada prueba es desplegada
con la el estadístico de prueba asociado y el Valor-P. Un Valor-P pequeño (arriba de 0.05 si esta
operando un nivel de significancia del 5%) rechaza la hipótesis nula y por lo tanto rechaza la
distribución normal. En la tabla anterior, los valores P son aceptables arriba de 0.05, no existe
significancia estadística de la no-normalidad de los datos.
Para una descripción detallada de las pruebas, vea la documentación detallada de Ajustando una
Distribución (Datos sin Censura).
Opciones del Panel
Incluir – Seleccione las pruebas que serán incluidas a la salida. Los pruebas por defecto son
definidas sobre la sección de Ajuste de Distribución de la caja de dialogo Preferencias accesible
desde el menú Edición.
Gráfico de Probabilidad
El Gráfico de Probabilidad es otro método por el cual podemos juzgar si o no la distribución
actual seleccionado describe adecuadamente a los datos.

Gráfica de Probabilidad
300
Media=254.64
Desv. Est.=10.6823
Normal Distribución
280
260
240
220
220 240 260 280 300
strength
El gráfico muestra los valores de los datos, ordenados de menor a mayor, graficado contra los
perceptiles equivalentes de la distribución ajustada. Si el ajuste de la distribución es un modelo
razonable para los datos, caerán aproximadamente a lo largo de una línea recta. Para el esfuerzo
de las botellas, la distribución normal hace un trabajo razonable.
Opciones del Panel
• Dirección: El eje sobre el cual los perceptiles de la distribución ajustada será graficado.
• Línea Estimada: Si Activa esta caja incluye una línea diagonal sobre el gráfico.
Comparación de Distribuciones Alternativas

Si hubiera una razón para dudar la adecuación de la distribución normal, una distribución
diferente puede ser seleccionada usando Opciones del Análisis. Para ayudarlo a determinar una
alternativa razonable, el panel Comparación de Distribuciones Alternativas ajusta una variedad
de diferentes distribuciones y las ordena de acuerdo al ajuste aceptable sobre los datos.

Comparación de Distribuciones Alternas

Distribución Parámetros Est. Log Verosimilitud KS D A^2
Laplace 2 -375.493 0.05 0.246061
Potenciación Exponencial 3 -375.389 0.0546134 0.249058
Logística 2 -377.021 0.0821372 0.440957
Loglogística 2 -377.324 0.0854092 0.499323
Normal 2 -378.253 0.0989897 0.788306
Gamma 2 -378.51 0.104262 0.834605
Birnbaum-Saunders 2 -378.695 0.107108 0.872569
Gaussiana Inversa 2 -378.695 0.107111 0.872599
Lognormal 2 -378.694 0.107325 0.88292
Weibull 2 -383.901 0.137322 1.82599
Valor Extremo Inferior 2 -385.804 0.145066 2.17477
Valor Extremo Superior 2 -389.32 0.15057 2.9171
Exponencial 1 -653.985 0.586708 42.309
Pareto 1 -825.078 0.623869 45.212
La tabla muestra:
• Distribución – El nombre de la distribución ajustada. Se pueden seleccionar

distribuciones adicionales usando Opciones del Panel.
• Est. Parámetros – El número de parámetros estimados para esa distribución.
• Log Verosimilitud – El logaritmo natural de la función de verosimilitud. Valores
grandes tienden a indicar la mejor distribución ajustada.
• KS D, A^2, y otros estadísticos – Valores de varios estadísticos para pruebas de
bondad-del-ajuste, se selecciona usando el botón Pruebas sobre la caja de dialogo de
Opciones del Panel. Los valores más pequeños tienden a indicar la mejor distribución
ajustada.
Las distribuciones son ordenadas de la mejor a la peor de acuerdo a una columna de la prueba de
bondad-del-ajuste. Esa columna es seleccionada usando el botón Pruebas sobre la caja de
dialogo de Opciones del Panel. La tabla anterior muestra las distribuciones ordenadas de acuerdo
al estadístico Anderson-Darling A2. De acuerdo a las estadísticas, la distribución Laplace tiene el
mejor ajuste.

Opciones del Panel
• Alternativas: Seleccione las distribuciones que pueden ajustarse a los datos.

• Más Común – Presione este botón para seleccionar las distribuciones más comunes.
• Localización-Escala – Presione esta botón para seleccionar todas las distribuciones que
están parametrizados por un parámetro de localización (como la media) y un parámetro de
escala (tal como la desviación estándar).
• Umbral – Presione este botón para seleccionar todas las distribuciones que contengan un
parámetro de umbral inferior.
• Todas – Presione este botón para seleccionar todas las distribuciones.
• Limpiar – Presione este botón para deseleccionar todas las distribuciones.
• Pruebas – Presione este botón para desplegar la caja de dialogo usando los estadísticos de
bondad-del-ajuste:
• Incluir – Seleccione el estadístico de bondad-del-ajuste para ser incluidos en la tabla. La

lista incluye la función de verosimilitud y varias estadísticas presentadas sobre el panel
de Bondad-del-Ajuste.
• Ordenar por – Seleccione una de las estadísticas a usar para ordenar las distribuciones
del mejor al peor.
Ejemplo – Ajustando una Distribución Laplace

Es interesante examinar las diferencias de una distribución Laplace que se ajusta a los datos
mejor que una distribución normal. Una distribución Laplace se enarbola en el centro y tiene
colas relativamente largas.
Capacidad de Proceso para strength

Laplace
LIE = 200.0, Nominal = 250.0, LSE = 300.0
Media=255.0
25 Escala=0.127226
20 Cp = 1.07
Pp = 1.04
frecuencia
15 Cpk = 1.01
Ppk = 0.98
10 K = 0.18
0
200 220 240 260 280 300 320
strength
Las líneas verticales ahora son colocadas en posiciones que cubren el 99.73% del centro de la
distribución Laplace, en lugar de más y menos 3 sigma. Esto resulta ser un rango mucho más
grande que antes.
Pueden realizarse otras comparaciones interesantes entre las distribuciones como se muestra en
la tabla:
Distribución Distribución
Normal Laplace
DPM – A Largo Plazo 11.03 2088.47
Ppk 1.415 0.981
Nivel de Calidad Sigma 5.74 4.36
Claramente, la estimación del desempeño del proceso es pesadamente dependiente sobre la

distribución que se utiliza.
Prueba de Bondad-del-Ajuste
Si alguna distribución a excepción de la normal se ajusta a los datos, la adecuación como un
modelo a los datos deberá probarse usando la Prueba de Falta-de-Ajuste. Hasta 7 diferentes
pruebas podrán desarrollarse. Para todas las pruebas, las hipótesis de interés son:

• Hipótesis Nula: Los datos son muestras independientes de la distribución especificada.
• Hipótesis Alternativa: Los datos no son muestras independientes de la distribución

especificada.
Pruebas Bondad-de-Ajuste para strength
Prueba de Kolmogorov-Smirnov
Laplace Distribución
DPLUS 0.0499018
DMINUS 0.05
DN 0.05
Valor-P 0.963945
Estadístico EDF Valor Forma Modificada Valor-P

Anderson-Darling A^2 0.246061 0.246061 >=0.10
*Indica que el Valor-P se ha comparado con tablas de valores críticos especialmente construidas para ajustar la distribución
actualmente seleccionada. Otros valores-P están basados en tablas generales y pueden ser muy conservadores.
Las pruebas deberán ejecutarse usando la selección de Opciones del Panel. Dos pruebas
comunes se muestran abajo. En cado caso, si el Valor-P es grande (mayor o igual que 0.05 si esta
operando a un nivel de significancia del 5%), entonces la distribución es un modelo razonable
para los datos. Para una descripción más detallada de las pruebas, vea la documentación
Ajustando una Distribución (Datos sin Censura).
Opciones del Panel
• Incluir: Seleccione una o más pruebas para desarrollar. Para la prueba Chi-Cuadrada,
seleccione usar clases equiprobables para agrupar los datos en clases con la misma
frecuencia esperada. Si esta opción no esta marcada, las clases serán creadas para emparejar
el Gráfico de Capacidad.
• Calcular Valor-P de Distribuciones Especificas – Si esta actividad, los valores P estarán

basados sobre tablas o formulas específicamente desarrolladas para la distribución

inicialmente probada. De lo contrario, los valores p estarán basados en un tabla general o
formula que se apliquen a todas las distribuciones. El enfoque general es más conservador
(no se rechazara una distribución tan fácilmente) puede ser preferido cuando se comparan los
valores P entre diferentes distribuciones.
Índices de Capacidad No-Normal

Cuando la distribución normal no se ajusta a los datos es necesario encontrar una distribución
alternativa, podemos calcular índices de capacidad diseñados específicamente para describir
datos no normales. STATGRAPHICS calcula dos tipos de índices no normales:
1. Un índice llamado Cp(q) basándose sobre los cuantiles de una curva para emparejar
el sesgo y la curtosis de los datos.
2. Un índice llamado Cpc que se basa en la distancia promedio absoluta de los valores
de los datos con respecto al valor objetivo.
Índices de Capabilidad No Normal para strength
Curva Pearson Seleccionada

Porcentaje Percentil Especificación
99.865 287.825 300.0
50 254.833 250.0
0.135 217.316 200.0
Índice Estimado
Pp(q) 1.41825
Ppk(q) 1.36902
Ppk (superior)(q) 1.36902
Ppk (inferior)(q) 1.46155
K(q) 0.0966624
Índice Estimado L.C. Inferior 95.0% L.C. Superior 95.0%

Cpc 1.44544 1.25357 1.70666
NOTA: estos índices están basados en las distancias entre los límites equivalentes 6-sigma y corresponden al desempeño a largo
plazo.
Los índices se calculan como sigue:
• Cp(q) – Para calcular este índice:
1. Calcular el sesgo y la curtosis de los datos.

2. Si el sesgo, es menor que -4, o si la curtosis es menor que -1.4 o mayor que 36.6, los
índices no serán calculados. De lo contrario, una curva de Pearson será seleccionada para
emparejar el sesgo y la curtosis muestral.
3. Estimación del perceptil 0.135, la mediana, y el perceptil 99.865 obtenidos de la Curva de
Pearson seleccionada.
4. Los índices de capacidad que son calculadas de la manera usual, excepto que la distancia
entre los perceptiles reemplazan la anchura de 6σ usual de la dispersión de una
distribución normal.
Observe el efecto sobre diversos índices comunes:

Asumiendo Usando el enfoque
Normalidad Cp(q)
Pp 1.56 1.42
Ppk 1.42 1.37
K 0.093 0.097
La capacidad estimada es un poco peor que con los índices estándar, que esta en línea con las
colas ligeramente largas. Sin embargo, el efecto no es tan dramático si una distribución
Laplace fuera seleccionada.
• Cpc – Para calcular este índice, asignamos:
USL − LSL (13)

C PC = n
π
∑x
i =1
i −T
k
2 n
donde k es comúnmente fijado en 6. Una propiedad interesante de este estadístico es que esta
basado sobre la distancia promedio absoluta de las observaciones con su valor objetivo T.
Gráfico de Tolerancia
El grafico de tolerancia grafica los datos por filas en orden con líneas horizontales indicando el
valor objetivo y los límites de especificación.
Carta de Tolerancia
300 300.00
280
260
strength
250.00
240
220
200 200.00
0 20 40 60 80 100
Observación

Opciones del Panel
• Lugares Decimales para los Límites – Número de lugares decimales para desplegar los
valores a la derecha del gráfico.
• Color de Zona: Activar esta caja para desplegar las zonas verde, amarillo y rojo.
Límites de Tolerancia Normal

Si los datos indican que los límites de especificación no son conocidos, será interesante
responder como puedo conocer esos límites. Un enfoque para establecer nuevos límites es
calcular los Límites de Tolerancia Normal. Los límites de tolerancia normal se encuentran en un
rango de valores para X con una confianza del 100(1-α)% para un porcentaje de la población P
sobre el cual los datos muestrales consiguen caer dentro de ese rango. Asumiendo que los datos
siguen una distribución normal, los limites de tolerancia a dos-colas pueden calcularse tomando
la media muestral mas y menos un múltiplo de la desviación estándar, de acuerdo a
x ± Ks (14)
El factor K depende sobre el tamaño de muestral n, el nivel de confianza (1-α), y la

especificación del porcentaje P.
Límites de Tolerancia Normal para strength

Distribución Normal
Tamaño de muestra = 100
Media = 254.64
Sigma = 10.6823
Especificaciones
LSE = 300.0
Nom = 250.0
LIE = 200.0
Limites de tolerancia del 95.0% intervalo de tolerancia para 99.99% de la población

Xbarra +/- 4.43186 sigma
Superior: 301.982
Inferior: 207.298
Por ejemplo, la tabla anterior declara que con una confianza del 95% el 99% de todas las botellas
producidas pueden tener un esfuerzo a la ruptura entre 207 y 301. Consecuentemente,
estableciendo especificaciones basadas en estos límites encontraremos una tasa de defectos no
mayor a una 1 botella fuera por cada 100,000.

Es importante notar que en el intervalo anterior no es simplemente el intervalo bajo la curva
normal ajustada conteniendo en un área del 99.99%. Es más amplio que este puesto que permite
la variabilidad del muestreo en ambos sobre la media y la desviación estándar.
Opciones del Panel
• Nivel de Confianza – Especifica el nivel de confianza para los límites de tolerancia, e.j.,
100(1-α)%.
• Proporción Poblacional – Especifica el porcentaje de la población P que obliga a los límites

de tolerancia.
Limites para Distribución-Libre

Los valores k-ésimo más pequeño y mas grande sobre una muestra de los datos puede usarse
para construir límites de tolerancia para la población de la cual provienen los datos sin que se
asuma alguna distribución especifica. Los límites de tolerancia resultantes se encuentran en un
rango de valores para X con una confianza del 100(1-α)% por lo menos para un porcentaje de la
población P sobre el cual los datos muéstrales consiguen caer dentro de ese rango .El intervalo
puede ser absolutamente conservador, con el actual porcentaje siendo muchos más grande que
los indicado.
Límites de Tolerancia de Distribución Libre para strength

Resumen de Datos
Recuento = 100
Máximo = 282.0
Mediana = 255.0
Mínimo = 225.0
Especificaciones
LSE = 300.0
Nom = 250.0
LIE = 200.0
Limites de tolerancia del 95.0% intervalo de tolerancia para 95.3433% de la población

Superior: 282.0
Inferior: 225.0
(Basados en una profundidad de intervalo = 1)
Por ejemplo, la tabla anterior toma los valores más extremos del esfuerzo e indica que con una
confianza del 95% por lo menos el 95.3433% de todas las botellas tendrían esfuerzo a la ruptura
entre 225 psi y 282 psi.

En este procedimiento, se puede seleccionar Opciones del Panel para cambiar el nivel de
confianza 100(1-α) o el porcentaje de la población P, pero no ambos.
Opciones del Panel
• Entrada – Especifica cambiar el nivel de confianza para el intervalo 100(1-α) o el

porcentaje de la población P.
• Profundidad del Intervalo – Específica el valor k utilizado para seleccionar las estadísticas
de orden sobre las cuales se basan los límites. En la creación del intervalo, el procedimiento
usa los valores k-ésimo más pequeño y más grande.
Gráfico X o X-barra
Un grafico X estándar es creado si los datos son individuos, mientras un grafico X-Barra es
creado para datos agrupados.
Carta X
300
285.13
280
strength
260
254.64
240
224.15
220
0 20 40 60 80 100
Observación
Los puntos fuera-de-control serán señalados por una señal roja, así como las violaciones de las
reglas de corridas si en las preferencias de Gráficos Control están incluidas las violaciones a las
reglas sobre los gráficos de control. Cualquier señal de fuera-de-control debe ser evaluada
cuidadosamente puesto que puede impactar en la estimación de la capacidad del proceso.
Opciones del Panel
Gráfico MR(2) o R
Un gráfico MR(2) es creado si los datos son individuos, mientras que un gráfico R será creado
para los datos agrupados.
Carta de Rangos
50
40
37.46
30
MR(2)
20
10 11.46
0 0.00
0 20 40 60 80 100
Observación

Opciones del Panel
Cálculos
Sigma a Largo Plazo
Sin ninguna corrección al sesgo:
n 2
∑ (x i − x)
σˆ = i =1 (15)
n −1
Con corrección del sesgo:
n 2
∑ (x
i =1
i − x)
n −1
σˆ = (16)
c 4 (n)
Sigma Corto Plazo – Individuales
Del promedio MR:
R
σˆ = (17)
d 2 ( 2)
De la mediana MR:
~
R
σˆ = (18)
d 4 ( 2)

De la media SSD sin corrección del sesgo:
∑ (x − x i −1 )
2
i
1
σˆ = i=2 (19)
2 n −1
De la media SSD con corrección del sesgo:
∑ (x − x i −1 )
2
i
1 i =2
2 n −1
σˆ = (20)
c ′4 (n)
Sigma Corto Plazo – Datos Agrupados
Del rango promedio:
k ⎛ f jRj ⎞
∑ ⎜⎜ d (n )⎟⎟
⎝
j =1 ⎠ (21)
σˆ =
2 j
k
∑f j =1
j
donde
d 22 (n j )
fi = (22)
d 32 (n j )
Del promedio s sin corrección del sesgo:

k
∑n
j =1
j sj
σˆ = (23)
k
∑n j =1
j
Del promedio s con corrección del sesgo:
k ⎛ f jsj ⎞
∑ ⎜⎜ c (n )⎟⎟
⎝
j =1 ⎠ (24)
σˆ =
4 j
k
∑h j =1
j
donde
c 42 (n j )
hj = (25)
1 − c 42 (n j )

De la s combinada sin corrección del sesgo:
∑ (n − 1)s 2j
k
j
j =1 (26)
σˆ =
∑ (n − 1)
k
j
j =1
De la s combinada con corrección del sesgo:
∑ (n − 1)s 2j
k
j
j =1 (27)
σˆ =
c 4 (d )∑ (n j − 1)
m
j =1
donde
d = 1 + ∑ (n j − 1)
k
(28)
j =1
Intervalos de Confianza para Cp
χ 12−α / 2, n −1 χ α2 / 2, n −1
Cˆ P ≤ C P ≤ Cˆ P (29)
n −1 n −1
Intervalos de Confianza para Cpk
⎡ 1 1 ⎤ ⎡ 1 1 ⎤
Cˆ PK ⎢1 − Z α / 2 + ⎥ ≤ C ≤ ˆ ⎢1 + Z
C + ⎥ (30)
2(n − 1) ⎥⎦ 2(n − 1) ⎥⎦
PK PK α / 2
⎢⎣ 9nCˆ PK
2
⎢⎣ 9nCˆ PK
2
Intervalos de Confianza para Cpc
Cˆ PC Cˆ PC
≤ C PC ≤ (31)
1 + t α / 2, n −1 s C / c n[ ( )] [ ( )]
1 − t α / 2, n −1 s C / c n
donde
n
∑x −T
, s C2 = 1 ⎛⎜ ∑ x i − T 2 − nc 2 ⎞⎟
i n
i =1
c= (32)
n n − 1 ⎝ i =1 ⎠

Intervalos de Confianza para Cpm
χ 12−α / 2,ν χ α2 / 2,ν

Cˆ PM ≤ C PM ≤ Cˆ PM (33)
ν v
donde
ν=
(n + λ )2 , ⎛ μˆ − T ⎞
2
λ = n⎜ ⎟ (34)
n + 2λ ⎝ σˆ ⎠

Análisis de Capabilidad-Variables PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Análisis de Capabilidad-Variables PDF

Cargado por

Copyright:

Formatos disponibles

STATGRAPHICS – Rev.

Análisis de Capabilidad (Variables)

Ejemplo StatFolio: capability.sgp

Datos del Ejemplo:

Caso #1: Individuales

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 1

• Datos: Columna numérica que contiene los datos a ser analizados.

• LES: Limite de Especificación Superior, si lo hay.

• Nominal: Valor objetivo o nominal opcional para la variable. Si no se ingresa, algunos

• LEI: Limite de Especificación Inferior, si lo hay.

• Selección: Selección de un subconjunto de los datos.

Al menos uno de los límites de especificación deberá ingresarse.

Caso #2: Datos Agrupados

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 2

Al menos uno de los límites de especificación deberá ingresarse.

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 3

Capacidad de Proceso para strength

El Gráfico de la Capacidad muestra:

1. Un Histograma de frecuencias para las muestra de los datos.

2. Líneas verticales largas en los límites de especificación y valor nominal.

4. Líneas verticales cortas en los perceptiles especificados de la distribución estimada. Por

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 4

• Límite Inferior: Límite inferior para el primer intervalo.

• Límite Superior: Límite superior para el último intervalo.

• Mantener: Mantiene el numero de intervalos y límites seleccionados incluso si los datos

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 5

Resumen del Análisis

Análisis de Capabilidad de Proceso(Individuales) - strength

6.0 Límites Sigma

Observados Estimados Defectos

• Variables de los Datos – La columna o columnas que contienen los datos.

• Transformación – Si una selección fue hecha en el campo Transformación de Datos sobre

• Distribución – La distribución asumida para los datos y la estimación o parámetros

Equivalente 6.0 Límites Sigma

Valor Z – Para una distribución normal, es la distancia de los límites de especificación a

Estimados arriba de Esp. – El porcentaje de la distribución ajustada más allá de los

Opciones del Análisis

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 7

• Incluir – El tipo de índices de capacidad para calcularse y presentarse sobre el Gráfico de

Solamente largo plazo (Etiquetado P) – Calcula solamente índices a largo plazo y lo

Solamente largo plazo (Etiquetado C) – Calcula solamente índices a largo plazo y lo

• Transformación de los Datos – El tipo de transformación aplicada a los datos antes de

Ninguno – Ajustar los datos originales.

Logaritmo – Ajustar el logaritmo natural de los datos.

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 8

Índices de Capabilidad para strength

Corto Plazo Largo Plazo

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 9

• CR/PR – La razón de capacidad, definida por:

Esta razón es el reciproco de Cp.

• CM/PM – El índice de capacidad de la maquina, definido por:

El denominador de este índice es fijado en 8-sigma.

• Z-LES – Un valor Z para el límite de especificación superior:

• Z-LEI – Un valor Z para el límite de especificación inferior:

© 2006 por StatPoint, Inc. Análisis de la Capacidad (Datos por Variables) - 10

• Z-MIN – El mínimo de los valores Z calculados:

Z MIN = min (Z LEI , Z LES ) (6)

Un valor Z de 4 corresponde a un Cpk de 1.33 si los datos provienen de una distribución

• Cpk(superior) – Un índice de capacidad basado en una-cola sobre el límite de

• Cpk(inferior) – Un índice de capacidad basado en una-cola sobre el límite de especificación

• Cpk – El mínimo de los dos índices de una-cola:

C PK = min (C PK (sup erior ) , C PK (inf erior ) ) (9)

Si el valor nominal no es especificado, entonces T será fijado en la mitad de los límites de