Está en la página 1de 21

SOLUCIÓN DESARROLLADA AL EJERCICIO DE REPETIBILIDAD Y REPRODUCIBILIDAD

UTILIZANDO EL MÉTODO DE ANÁLISIS DE VARIANZAS (ANOVA)

Desarrollado por: Jaime Cortés Ronquillo

Resumen: El presente artículo muestra la solución e interpretación del ejercicio de repetibilidad y reproducibilidad del
Manual de MSA (Measument System Analysis) 4ª edición de la AIAG (Automotive Industry Action Group)1 por medio
de la técnica estadística de análisis de varianzas o método ANOVA. Es un desarrollo detallado del autor y los resultados
a los que se llegan son los mismos que se muestran en el manual, se realiza a través de gráficos de excel y se
complementan con anotaciones para su mayor comprensión, desglosando las fórmulas y haciendo explicaciones de
estas.

INTRODUCCIÓN

Las variaciones de un proceso de medición, de manera general, son la repetibilidad y la reproducibilidad:

Figura 1. Origen de la variación de un proceso de medición.2

La Figura 2 muestra de manera esquemática los diferentes tipos de variación, nótese que la variación de la
medición debe ser muy pequeña con respecto a la variación de la parte.

Figura 2. Comparación de la variación del proceso productivo con un proceso de medición.3

Los estudios de repetibilidad y reproducibilidad (RyR) son aplicados normalmente por metrólogos, ingenieros de
calidad o técnicos, pero se recomienda que su interpretación sea conocida por todos los involucrados en el proceso
de medición, aprobación y evaluación de la confiabilidad del método de medición. Cabe mencionar que no son los
únicos estudios para un sistema de medición de variables, pero deben ocuparse en función de la aplicación de la
parte y de común acuerdo con el cliente.

ja.cortes.052@gmail.com Página 1 de 21
Los estudios RyR se aplican a la mayoría de los sistemas de medición para piezas de la manufactura y pueden
usarse como un criterio para:
• Aceptar un sistema de medición.
• Juzgar nuevos dispositivos de medición.
• Una comparación entre equipos de medición.
• Una comparación de equipos de medición o gages antes y después de una reparación.
• Determinar la necesidad de capacitación sobre cómo utilizar los instrumentos y entender el método de medición.
Los métodos para calcular los estudios RyR pueden dividirse de la siguiente manera:
1) Método de los Rangos (conocido como método corto).
2) Método de los Promedios y Rangos (llamado método largo X-R, incluye el método de las gráficas de control).
3) Método de ANOVA (conocido como método largo anidado, también utiliza el método de gráficas de control).
Estos métodos calculan estimativos del sistema de medición para utilizarlos como criterios de aceptación o al
menos demostrar que el sistema es confiable y se puede validar por medio de gráficos y análisis estadísticos.
El presente artículo muestra el método desglosado para solucionar e interpretar el ejercicio de repetibilidad y
reproducibilidad del Manual de MSA (Measument System Analysis) 4ª edición de la AIAG (Automotive Industry Action
Group) por medio de la técnica estadística de análisis de varianzas (ANOVA) y los resultados se comparan con los
que presenta el Manual de MSA para el método de los Promedios y Rangos (X-R).

ANTECEDENTES
Métodos utilizados para estudios RyR
1. Método de los rangos, es un método corto y calcula una aproximación rápida de la variabilidad de las mediciones
con el cálculo del estimativo RRG pero no hace una diferenciación entre la repetibilidad y la reproducibilidad.
2. Método X-R, es también conocido como cruzado y es un método largo el cual calcula varios estimativos de
acuerdo con la siguiente tabla:
EV (Equipment Variation) Repetibilidad Variación estimada debida a el equipo, gage o
instrumento de medición.
AV (Appraiser Variation). Reproducibilidad Variación estimada debida a la medición por los
evaluadores que realizan las mediciones.
RRG (Repeatability and Estimativo de Repetibilidad Variación combinada estimada de Repetibilidad y
Reproducibility Gage). y Reproducibilidad. Reproducibilidad.
ndc (número de Número de categorías Número de categorías distintas que el sistema de
categorías distintas). distintas. medición puede discriminar o si el sistema de medición
puede distinguir entre mediciones de partes diferentes.
Normalmente es uno de los criterios que se utilizan junto
con el RRG y algún otro estudio/criterio que defina el
cliente para aceptar o rechazar un sistema de medición.
PV (Part Variation). Variación de la parte en el Depende de la forma en que se determina el intervalo de
estudio del sistema de partes donde se realiza el estudio, esto es muy
medición. importante para que el estudio de RyR sea confiable y
tenga resultados aceptables.
TV (Total Variation). Variación Total en el estudio La variación en el intervalo de las partes más la variación
del sistema de medición. del RRG
Tabla 1. Estimativos para un estudio de repetibilidad y reproducibilidad (RyR).

ja.cortes.052@gmail.com Página 2 de 21
3. Método ANOVA, calcula los estimativos EV, AV, RRG, PV, TV y uno más: la interacción evaluador-Parte IAP
(Interaction Appraiser-Part) esta última es muy importante sobre todo cuando se realizan mediciones que no
pueden replicarse porque la muestra o la parte es destruida o deformada durante el desarrollo de la prueba, por
eso es un método anidado dado que cada muestra destruida o deformada puede tener una interacción con el
evaluador, es decir, puede ser que evaluador infiera en el resultado de la medición por cada parte. Este método
también puede aplicarse a mediciones no destructivas siendo aún más preciso.

Comparación de métodos utilizados para estudios RyR


La siguiente tabla muestra un comparativo de los estimativos calculados en cada método:
Métodos para RyR
Estimativos Corto Largos
Calculados Cruzado ANOVA
Rangos
(X-R) (anidado)
EV
AV
RRG
IAP
PV
TV
ndc

Tabla 2. Comparación de estimativos para un estudio de repetibilidad y reproducibilidad (RyR).

Como se mencionó anteriormente, los criterios que normalmente se utilizan para aceptar un sistema de medición
son el RRG y el ndc (marcados en verde en la Tabla 2) es por esto que existen lineamientos generales en el manual
del AIAG y son los que se muestran a continuación:
• RRG <10% aceptable.
• RRG entre 10 y 30% marginalmente aceptable dependiendo de la aplicación de la medición.
• RRG > 30% inaceptable.
• ndc > 5 aceptable.
El manual menciona estos criterios como una regla empírica, pero las OEM (original equipment manufacturer) o
bien los clientes, pueden ser todavía más estrictos en algunos casos y pedir, según sus manuales de calidad, que se
obtengan valores más bajos para RRG y más alto para el ndc si su aplicación requiere de más precisión.
Para ello se tiene que consultar con el representante autorizado del cliente para que proporcione información de
lo que puede o no aceptarse.
Método X-R
El método cruzado es también conocido como X-R por usar promedios (X) y rangos (R) de mediciones de
evaluadores y partes. En él, cada operador mide las mismas partes al menos dos veces y se utiliza para determinar
cuánta variación del proceso se debe a la variación del sistema de medición; se aplica generalmente para mediciones
no destructivas porque las partes no se destruyen o se deforman durante la medición. Por ejemplo, cuando se mide
la longitud de una parte y la parte no cambia durante la medición; puede ser representado de la siguiente manera:

ja.cortes.052@gmail.com Página 3 de 21
Figura 3. Representación gráfica del método cruzado X-R para un estudio RyR.4
Método ANOVA
El método que utiliza el análisis de varianza (ANOVA) también se conoce como anidado o pegado, fue desarrollado
inicialmente por el estadístico y biólogo Ronal A. Fischer a inicios de los años de 1920. La técnica básicamente consiste
en comparar un conjunto de mediciones para determinar si las variaciones entre ellas son debido a causas comunes
o éstas se deben a variaciones atribuibles a causas especiales o a algún parámetro en particular durante el proceso
de medición p.e. influye la forma de tomar las muestras, la hora del día que se toman, variaciones ambientales, el
patrón que se utiliza, la pieza de trabajo, el instrumento de medición, la persona que lo hace, la aplicación del
procedimiento, etcétera. Es muy importante para este método que los datos se recolecten de forma aleatoria y sin
inferencias.
El ANOVA se usa cuando cada evaluador mide partes que no pueden replicarse por otro evaluador como es el
caso de pruebas destructivas p.e. al verificar si una barra metálica cumple una especificación ésta se deforma o se
destruye por efecto de la fuerza aplicada lo que hace inviable su reutilización. También puede ser utilizado para
analizar los errores de las mediciones y otras fuentes de variabilidad, por tanto, la varianza puede ser seccionada en
cuatro componentes:
1. Partes.
2. Evaluadores.
3. Interacciones entre evaluadores y partes.
4. Error de replicación debido al equipo o gage de medición.
La parte crítica de un estudio RyR anidado es identificar y colectar lotes de material homogéneo de tal forma que
se pueda suponer que las partes de un mismo lote son equivalentes entre sí, para sustentarlo se puede aplicar una
medida de variabilidad como la desviación estándar. La homogeneidad de cada lote es la clave para ejecutar un
estudio de manera aceptable con piezas que serán destruidas o deformadas con la medición, ver la representación
del estudio en la Figura 4.

Figura 4. Representación gráfica del método anidado que utiliza ANOVA para un estudio RyR.

ja.cortes.052@gmail.com Página 4 de 21
Las ventajas de esta técnica comparadas con el método de rangos y promedios (cruzado o X-R) son las siguientes:
• Son capaces de manejar cualquier ajuste experimental.
• Pueden estimar las variaciones en forma más exacta.
• Calcula más información de datos experimentales como, por ejemplo el efecto de la interacción de las partes
y los evaluadores.
DESARROLLO
El presente artículo muestra el desarrollo detallado por el método ANOVA del ejercicio de Repetibilidad y
Reproducibilidad del Manual de MSA 4ª edición. En dicho estudio, tanto para el ejemplo del método X-R (hoja de
datos GRR en Figura III-B 6a) como para el método ANOVA (hoja de datos R&RG en Figura III-B 15), la AIAG muestra
los mismos datos obtenidos de 3 evaluadores A, B y C donde cada uno hace de manera aleatoria tres mediciones de
10 partes diferentes medidas sin inferencia, por ejemplo, mediante mediciones en tiempos diferentes por esos mismos
evaluadores sin que ellos reconozcan qué pieza es la que están evaluando en cada ocasión.
Lo que se busca en el ejercicio RyR es determinar mediante los estimativos si las poblaciones de mediciones de
los tres evaluadores tienen una asociación o no. Los datos a los que se hace referencia son los que se muestran en
la Tabla 3:

Tabla 3. Datos de mediciones de 3 evaluadores con tres intentos para 10 muestras.1

De dicha tabla se puede determinar que los siguientes factores:


n= número de partes
k= número de evaluadores
r= número de intentos por cada evaluador
quedan de la siguiente manera: n= 10, k= 3 y r= 3.

Para iniciar el análisis, hacemos las gráficas de caja para las partes medidas por cada evaluador con la finalidad
de observar la variación de las mediciones de los evaluadores, ver la Figura 5. Se puede observar en el gráfico que
existen variaciones en las mediciones de cada evaluador y entre ellos.

ja.cortes.052@gmail.com Página 5 de 21
Figura 5. Gráfico de cajas de las mediciones por cada evaluador.
Lo que ahora se requiere saber es si estas variaciones son significativas estadísticamente o no y si son debido a
causas comunes que le pueden pasar a cualquier evaluador en cualquier turno o esas variaciones se atribuyen a otras
causas tales como la forma de utilizar el equipo de medición o bien, si existen otros factores externos que estén
afectando. Es importante recalcar que se debe encontrar los factores externos para detectarlos y finalmente,
controlarlos ya que de las mediciones realizadas se toman decisiones sustanciales como el ajuste de los procesos
productivos.
Para conocer la significancia de las variaciones usamos el ANOVA y planteamos dos hipótesis: una inicial o nula
(H0) y otra alternativa (H1) que se utilizaran en el estudio RyR para el cálculo de los estimativos AV, PV, IAP.
Para los evaluadores (AV) queda de la siguiente manera:
• H0= variación de medición del evaluador A = Variación de medición del evaluador B = Variación de la medición
del evaluador C.
• H1= Existe una diferencia al menos entre dos mediciones de los evaluadores.
La hipótesis nula o inicial no será aceptada si la F- estadística calculada > F-crítica*

Para las partes (PV) queda de la siguiente manera:


• H0= Parte 1 = Parte 2 = Parte 3= Parte 4……= Parte 10
• H1= Existe una diferencia al menos entre dos partes
La hipótesis nula o inicial no será aceptada si la F- estadística calculada > F-crítica*
(Esta hipótesis solo es para confirmar que efectivamente existe una variación significativa de las partes ya que de
inicio se seleccionan de manera intencional partes que no son iguales entre sí, se detalla por qué más adelante.) Para
la interacción evaluador-parte (IAP) queda de la siguiente manera:
• H0= Interacción del evaluador A con las partes = Interacción del evaluador B con las partes =Interacción del
evaluador C con las partes.
• H1= Existe una diferencia al menos entre alguna interacción de los evaluadores A, B y C con las partes.
La hipótesis nula o inicial no será aceptada si la F- estadística calculada > F-crítica*
* Para todos los casos, la F-crítica es obtenida mediante la tabla F de Fischer.
Para realizar el estudio de RyR por el método ANOVA, se utiliza la siguiente tabla de análisis de varianza para
determinar la variación total en cuatro componentes: partes, evaluadores, interacción de los evaluadores y las partes,
así como la repetibilidad debida al instrumento.

ja.cortes.052@gmail.com Página 6 de 21
Tabla 4. Análisis de varianzas (ANOVA) de fuentes de variación.

Donde la Tabla ANOVA se compone de las siguientes 6 columnas:


• Fuentes, es la causa de la variación.
• GL, son los grados de libertad asociados con la fuente.
• SS o suma de cuadrados, es la desviación alrededor del promedio de la fuente.
• MS o promedio de cuadrados, es la suma de los cuadrados divididos por sus grados de libertad.
• Razón o proporción F calculada para determinar la significancia estadística del valor de la fuente.
• EMS o cuadrado medio esperado (expected mean square).

La suma de cuadrados de cada fuente de variación se calcula utilizando las siguientes fórmulas:

n
 xi2..  x...2
SS P =    −
i =1  kr  nkr
k  x2  2
x
SS A =   −
. j. ...

j =1  nr 
 nkr

( ) x...2
n k r
TSS =  x 2
ijm −
i =1 j =1 m =1 nkr
n  xij2.  n  xi2..  k  x.2j .  x...2
k
SS AP =    − 
  −   +

i =1 j =1  r 
 i =1  kr 
  nkr
j =1  nr 

SS E = TSS − SS A + SS P + SS AP 
Tabla 5. Fórmulas para calcular la suma de cuadrados de acuerdo con la fuente de variación.1
Aunque las fórmulas parezcan complejas en realidad no lo son, lo único que se requiere es conocer cómo
ordenarlas en una hoja de cálculo de un programa como excel, hacer correctamente las sumatorias y conocer que
las “Xi” se obtiene de la suma de las mediciones de las partes y las “Xj” se calcula de la suma de las mediciones de
los intentos de los evaluadores.

ja.cortes.052@gmail.com Página 7 de 21
Iniciemos con la primera suma de cuadrados SSP (Suma de cuadrados de las partes): Se tienen 3 evaluadores por
tanto k = 3, son 3 el número de intentos y por eso r = 3, mientras que Xi es el resultado de la suma de las mediciones
de cada parte. De tal manera que si juntamos las mediciones hechas por los evaluadores de todas las partes y
colocamos las sumatorias, tendremos una tabla de la siguiente manera:

Partes
Intentos 1 2 3 4 5 6 7 8 9 10
1 0.29 -0.56 1.34 0.47 -0.80 0.02 0.59 -0.31 2.26 -1.36
2 0.41 -0.68 1.17 0.50 -0.92 -0.11 0.75 -0.20 1.99 -1.25
3 0.64 -0.58 1.27 0.64 -0.84 -0.21 0.66 -0.17 2.01 -1.31
1 0.08 -0.47 1.19 0.01 -0.56 -0.20 0.47 -0.63 1.80 -1.68
2 0.25 -1.22 0.94 1.03 -1.20 0.22 0.55 0.08 2.12 -1.62
3 0.07 -0.68 1.34 0.20 -1.28 0.06 0.83 -0.34 2.19 -1.50
1 0.04 -1.38 0.88 0.14 -1.46 -0.29 0.02 -0.46 1.77 -1.49
2 -0.11 -1.13 1.09 0.20 -1.07 -0.67 0.01 -0.56 1.45 -1.77
3 -0.15 -0.96 0.67 0.11 -1.45 -0.49 0.21 -0.49 1.87 -2.16
Xi 1.5200 -7.6600 9.8900 3.3000 -9.5800 -1.6700 4.0900 -3.0800 17.4600 -14.1400

Tabla 6. Cálculo de las Xi.

La sumatoria de Xi2 se obtiene de sumar el cuadrado de los valores de Xi de las 10 partes, tal y como se muestra
a continuación:
Xi 1.5200 -7.6600 9.8900 3.3000 -9.5800 -1.6700 4.0900 -3.0800 17.4600 -14.1400
2
Xi 2.3104 58.6756 97.8121 10.8900 91.7764 2.7889 16.7281 9.4864 304.8516 199.9396
2
∑Xi 795.2591

Tabla 7. Cálculo de la sumatoria X2i


Con lo que obtenemos el numerador de la primera parte de la ecuación y después sustituir los valores de k y r,
tenemos el valor del primer término:

= 795.259 = 88.3621
3*3

Utilizando nuevamente la Tabla 6 ahora vamos a calcular X2, para esto se suman las mediciones de las 10 partes
de cada intento para cada uno de los operadores y se coloca el resultado al final de cada renglón, de esta forma se
obtienen 9 resultados que al sumarse dan el valor de X, lo elevamos al cuadrado y determinamos el valor de X2 como
sigue:
Partes
Intentos 1 2 3 4 5 6 7 8 9 10
1 0.29 -0.56 1.34 0.47 -0.80 0.02 0.59 -0.31 2.26 -1.36 1.94
2 0.41 -0.68 1.17 0.50 -0.92 -0.11 0.75 -0.20 1.99 -1.25 1.66
3 0.64 -0.58 1.27 0.64 -0.84 -0.21 0.66 -0.17 2.01 -1.31 2.11
1 0.08 -0.47 1.19 0.01 -0.56 -0.20 0.47 -0.63 1.80 -1.68 0.01
2 0.25 -1.22 0.94 1.03 -1.20 0.22 0.55 0.08 2.12 -1.62 1.15
3 0.07 -0.68 1.34 0.20 -1.28 0.06 0.83 -0.34 2.19 -1.50 0.89
1 0.04 -1.38 0.88 0.14 -1.46 -0.29 0.02 -0.46 1.77 -1.49 -2.23
2 -0.11 -1.13 1.09 0.20 -1.07 -0.67 0.01 -0.56 1.45 -1.77 -2.56
3 -0.15 -0.96 0.67 0.11 -1.45 -0.49 0.21 -0.49 1.87 -2.16 -2.84
X= 0.1300
X2= 0.0169

Tabla 8. Cálculo de X2.

ja.cortes.052@gmail.com Página 8 de 21
Sustituyendo los valores de n, k y r ya conocidos, la ecuación nos queda de la siguiente manera:

= 0.0169 = 0.0002
10*3*3

Con este valor ya podemos determinar el valor de la suma de cuadrados de las partes y queda así:

= 88.3621 - 0.0002 = 88.3619

Ahora calculemos la suma de cuadrados de los evaluadores SSA de la segunda fórmula de la Tabla 5: Primero
sumaremos las medidas de cada evaluador de las 10 partes y los 3 intentos y así obtenemos Xj, este valor se eleva al
cuadrado y se hace la sumatoria tal y como se muestra en la Tabla 9.

Xj Xj2
X j=1 5.7100 32.6041
X j=2 2.0500 4.2025
X j=3 -7.6300 58.2169
∑Xj2 95.0235

Tabla 9. Cálculo de la sumatoria Xj2

Si sustituimos los valores obtenidos y los valores ya conocidos de n y r, la ecuación nos queda como:

95.0235
= = 3.1675
10*3

Como el sustraendo ya lo calculamos en una operación previa, podemos completar el cálculo de la suma
de cuadrados de los evaluadores de la siguiente forma:

= - = 3.1673

Ahora trabajemos con la cuarta fórmula de la Tabla 5. En primera instancia, calculemos la suma de cuadrados de
la interacción de evaluadores y partes SSAP, para este caso primero realizaremos la tabla de cuadrados de la suma de
las mediciones por evaluador y parte, es decir, la suma de las mediciones de cada evaluador con sus tres intentos por
cada parte y después elevado al cuadrado, tal y como se muestra a continuación:

ja.cortes.052@gmail.com Página 9 de 21
X2ij j (# de partes) ∑X
2
ij

i (# intentos) 1.7956 3.3124 14.2884 2.5921 6.5536 0.0900 4.0000 0.4624 39.1876 15.3664 87.6485

0.1600 5.6169 12.0409 1.5376 9.2416 0.0064 3.4225 0.7921 37.3321 23.0400 93.1901

0.0484 12.0409 6.9696 0.2025 15.8404 2.1025 0.0576 2.2801 25.9081 29.3764 94.8265
∑X2ij 2.0040 20.9702 33.2989 4.3322 31.6356 2.1989 7.4801 3.5346 102.4278 67.7828 275.6651

Tabla 10. Cálculo de la sumatoria ∑X2ij.


Para el caso de este cálculo observamos en la ecuación que tenemos los tres últimos términos y solo falta calcular
la sumatoria de Xij2 dividido sobre r=3, sustituyendo valores tenemos:

= 275.6651 = 91.8884
3

Finalmente, con los valores ya definidos procedemos a determinar SSAP

- - + = 0.3590

Ahora vamos a calcular la suma de cuadrados total, fórmula 3 de la Tabla 5; para ello vamos a requerir hacer la
tabla de cuadrados de todas las mediciones individuales Xijm2 y posteriormente sumarlas, la tabla con el cálculo nos
queda de la siguiente manera:

Partes
Intentos 1 2 3 4 5 6 7 8 9 10
1 0.0841 0.3136 1.7956 0.2209 0.6400 0.0004 0.3481 0.0961 5.1076 1.8496
2 0.1681 0.4624 1.3689 0.2500 0.8464 0.0121 0.5625 0.0400 3.9601 1.5625
3 0.4096 0.3364 1.6129 0.4096 0.7056 0.0441 0.4356 0.0289 4.0401 1.7161
1 0.0064 0.2209 1.4161 0.0001 0.3136 0.0400 0.2209 0.3969 3.2400 2.8224
2 0.0625 1.4884 0.8836 1.0609 1.4400 0.0484 0.3025 0.0064 4.4944 2.6244
3 0.0049 0.4624 1.7956 0.0400 1.6384 0.0036 0.6889 0.1156 4.7961 2.2500
1 0.0016 1.9044 0.7744 0.0196 2.1316 0.0841 0.0004 0.2116 3.1329 2.2201
2 0.0121 1.2769 1.1881 0.0400 1.1449 0.4489 0.0001 0.3136 2.1025 3.1329
3 0.0225 0.9216 0.4489 0.0121 2.1025 0.2401 0.0441 0.2401 3.4969 4.6656
Sumatorias 0.7718 7.3870 11.2841 2.0532 10.9630 0.9217 2.6031 1.4492 34.3706 22.8436
∑X2ijm 94.6473

Tabla 11. Cálculo de la sumatoria ∑X2ijm

ja.cortes.052@gmail.com Página 10 de 21
n
 xi2..  x...2
Es decir, SS P =    −
i =1  = kr  94.6473 nkr
2  x. j . 2
k 2 2
x
A = 
n
 xi..  x... −

...
SS P =SS  requiere−nr  nkr
Como ya tenemos el sustraendo que j =1 la  podemos sustituirlo para calcular TSS:
ecuación
i =1  kr  nkr
( ) x...2
n k r
k  x2 
SS A =   
TSS = . j .  x... xijm −
2 2
− m =1 94.6473 nkr-
j =1 
 nri =1 j =1 =
nkr
= 94.6471

k  x2 
 xi2..  k  x. j .  x...2
n n 2

SS AP =  2
( ) x...−    −   +
n k r ij . 2
cálculo=
Continuamos con elTSS de
la sumatoria dexcuadrados − 
del equipo  SS de acuerdo con la  nkrfórmula:
siguiente
1  r nkr  i =1  kr  j =1  nr 
E
i =1 j =ijm
i =1 j =1 m =1
SS En =kTSS  xij2−. SS An +SS x 2P + SS 2
 k AP x. j .  x...2
SS AP =    − 

i ..
 −   +

Sustituyendo los valores de la sumatorias de cuadrados
i =1 j =1  r 
 obtenemos SS :
i =1  kr 
E 
j =1  nr 
 nkr
SS E = TSS − SS - [ +3.1673
A SS P ++SS 88.3619 AP  + 0.3590 ] = 2.7589

Recordemos que la Tabla ANOVA sectoriza la fuente total de variación en los cuatro componentes mencionados:
partes, evaluadores, interacción entre las partes y los evaluadores, así como el error replicado debido a la repetibilidad
del equipo o gage. Ahora retomaremos las ecuaciones de la Tabla 4, con las fórmulas de la segunda columna
calculamos los grados de libertad para las distintas fuentes, los valores de suma de cuadrados simplemente se
sustituyen con los que fueron obtenidos anteriormente, para la columna de promedio de cuadrados se divide la suma
de los cuadrados de la columna previa por sus grados de libertad, la F estadística se obtiene al dividir el promedio de
cuadrados de cada fuente por el promedio de equipo, la F crítica se determina mediante del uso de las tablas de
Fischer con =0.05 y los valores de los cuadrados medios esperados se obtienen con las fórmulas de la columna 6
de la Tabla ANOVA y las varianzas calculadas posteriormente según el modelo adecuado al tipo de interacción
encontrada. F F
Fuente GL SS MS estadística EMS
critica
calculada F F
Fuente GL SS MS estadística EMS
Evaluador 2 SS A = 3.1673 MS A = 1.5836 34.4401 3.1504 1.5836critica
calculada

Parte 9 SS P
Evaluador = 88.3623
2 SSMS
A =P =3.1673
9.8180 MS A = 1.58362.0401
213.5171 34.4401
9.81803.1504 1.5836

Evaluador por
parte
18Parte SS AP = 90.3590 SSMS
P =AP88.3623
= 0.0199 MS P = 9.81801.7784
0.4337 213.5171
0.04002.0401 9.8180

Evaluador por
Equipo 60
parte SS E = 182.7589 SS AP
MS =
E = 0.3590
0.0460 MS AP = 0.0199 0.43370.04001.7784 0.0400

Total Equipo TSS


89 94.6471 SS E =
= 60 2.7589 MS E = 0.0460 0.0400

Total 89 TSS = 94.6471

Tabla 12. Tabla ANOVA con resultados de F estadísticas calculadas y críticas.

ja.cortes.052@gmail.com Página 11 de 21
Es importante mencionar que el cálculo de EMS (expected mean square) determina la combinación lineal de los
componentes de varianza para cada promedio de cuadrados (MS). Para este caso, los cuadrados medios esperados
(EMS) son iguales ya que, como veremos más adelante, se trata de un modelo sin interacción entre evaluadores y
partes, por eso el EMS del equipo y de la interacción son iguales.

Antes de continuar tenemos que revisar las hipótesis que se plantearon al inicio de los cálculos del ANOVA para
este análisis.
Empezaremos con las hipótesis de la variación de los evaluadores (AV):
• H0= Variación de medición del evaluador A = Variación de medición del evaluador B = Variación de la medición
del evaluador C.
• H1= Existe una diferencia al menos entre dos mediciones de los evaluadores.
La hipótesis inicial plantea que la variación que tiene cada evaluador no es significativa estadísticamente hablando
y se debe a causas comunes que cualquier evaluador podría tener durante el turno o el día. Por tanto, la hipótesis H0
no será aceptada si la F estadística calculada es mayor que la F crítica. Es decir,

F- estadística calculada > F-critica (de tabla F)

Rechazar la hipótesis H0

Para este caso:

34.4401 > 3.1504

Por lo cual la hipótesis H0 no se acepta pero si acepta la hipótesis alternativa H1 sí existen diferencias significativas
en las mediciones de los evaluadores.

Para identificar las causas de la variación, primero graficamos el promedio de los tres intentos de cada evaluador
por parte, tal y como se muestra en la siguiente figura:

Figura 6. Gráfico de las mediciones por parte de cada evaluador.

ja.cortes.052@gmail.com Página 12 de 21
El gráfico de las interacciones muestra que el evaluador C tiene una tendencia a medir por debajo del límite inferior
LIC y es también el que mayor variación presenta, tal y como lo habíamos notado anteriormente en los gráficos de
cajas de la Figura 5.
Otro esquema que nos puede ayudar para encontrar las causas es la gráfica de rangos con su límite de control,
ya que nos permite visualizar la repetibilidad y la consistencia del proceso de medición entre los evaluadores, por
ejemplo, si un evaluador esta fuera de control puede deberse a que el método usado para medir difiere del de los
otros evaluadores y es necesario descubrir cuáles son esas diferencias para homologar los criterios de medición. Si
todos los evaluadores están fuera de los rangos de control quiere decir que el proceso de medición es sumamente
sensible a la técnica utilizada y se requiere robustecer para evitar variaciones por este factor. La Figura 7 muestra el
gráfico de rangos y se puede observar en él que hay diferencia de variabilidad entre los evaluadores.

Figura 7. Gráfica de rangos “Estancada”

Continuamos con las hipótesis de la variación de partes (PV):


• H0= Parte 1 = Parte 2 = Parte 3= Parte 4……= Parte 10
• H1= Existe una diferencia al menos entre dos partes
De acuerdo con el manual, es recomendable que el número de categorías distintas (ndc) sea igual o mayor a 5
para asegurar que las partes sean representativas de la distribución del proceso de producción, para ello la persona
que controla el estudio debe tomar partes en toda la tolerancia de las mediciones lo que implica de antemano que las
piezas no tienen dimensiones similares entre sí, es decir, para el estudio se escogen intencionalmente piezas en todo
el intervalo lo que garantiza que las partes NO son iguales. Por lo tanto, antes del análisis de la F estadística calculada
sabemos que la H0 no será aceptada y lo verificamos al sustituir los valores de F estadística calculada y F crítica:

213.5171 > 2.0401


Con este resultado concluimos que sí existen diferencias significativas entre las partes y, por tanto no aceptamos
H0 y si aceptamos H1.
A continuación, promediamos las mediciones por cada número de parte y con el valor obtenido ordenamos las
columnas de forma ascendente para obtener la Tabla 13 con la que realizaremos el gráfico de cajas de la Figura 8.

ja.cortes.052@gmail.com Página 13 de 21
Tabla ordenada por promedio de medición de menor a mayor
A (P10) B (P05) C (P02) D (P08) E (P06) F (P01) G (P04) H (P07) I (P03) J (P09)
-1.36 -0.80 -0.56 -0.31 0.02 0.29 0.47 0.59 1.34 2.26
-1.25 -0.92 -0.68 -0.20 -0.11 0.41 0.50 0.75 1.17 1.99
-1.31 -0.84 -0.58 -0.17 -0.21 0.64 0.64 0.66 1.27 2.01
-1.68 -0.56 -0.47 -0.63 -0.20 0.08 0.01 0.47 1.19 1.80
-1.62 -1.20 -1.22 0.08 0.22 0.25 1.03 0.55 0.94 2.12
-1.50 -1.28 -0.68 -0.34 0.06 0.07 0.20 0.83 1.34 2.19
-1.49 -1.46 -1.38 -0.46 -0.29 0.04 0.14 0.02 0.88 1.77
-1.77 -1.07 -1.13 -0.56 -0.67 -0.11 0.20 0.01 1.09 1.45
-2.16 -1.45 -0.96 -0.49 -0.49 -0.15 0.11 0.21 0.67 1.87
-1.57 -1.06 -0.85 -0.34 -0.19 0.17 0.37 0.45 1.10 1.94

Tabla 13. Mediciones de las partes ordenadas por su promedio.

Figura 8. Gráfico de cajas de las mediciones por parte.


Al observar el gráfico de cajas nos damos cuenta de que las partes para este estudio están distribuidas en un
intervalo entre -2.00 a 2.00, que podría ser las tolerancias de la especificación o el rango que se definió para el estudio,
aunque como tal, no lo marca el texto del manual.
Revisemos ahora el caso de la interacción de operadores y partes (IAP)
• H0= Interacción del evaluador A con las partes = Interacción del evaluador B con las partes =Interacción del
evaluador C con las partes.
• H1= Existe una diferencia al menos entre alguna interacción de los evaluadores A, B y C con las partes.
Para que hipótesis H0 no sea aceptada, la F estadística calculada debe ser mayor que la F crítica. En este caso,
tenemos un resultado interesante ya que la F estadística calculada es menor que la F crítica:

NO
0.4337 > 1.7784

ja.cortes.052@gmail.com Página 14 de 21
Por lo tanto, la H0 debe ser aceptada para el estimativo IAP. Esto indica que, para este ejercicio, las interacciones
del evaluador con la parte medida no son significativas tal y como lo vimos en la Figura 6 en donde se nota que las
líneas de los tres evaluadores son casi paralelas. Si existiera interacciones lo cual no es deseable, se tendrían que
tomar acciones para eliminar las causas que ocasionan estas.

Otra gráfica que nos puede ayudar para hacer un chequeo de la validez de los supuestos es el gráfico de residuos,
los residuos se calculan a partir de la diferencia de la lectura observada y los promedios de las lecturas repetidas por
cada evaluador para cada parte. El error debido al equipo es una variable aleatoria de una distribución normal, por lo
cual los valores residuales graficados no deberían mostrarse dispersos. La Figura 9 presenta el gráfico de residuales
de este estudio, en él se puede observar que los residuos de las mediciones de cada evaluador no son dispersos con
respecto a la línea horizontal de referencia.

Figura 9. Gráfico de residuales de mediciones de operadores por parte.


Basado en las observaciones anteriores, la siguiente etapa es analizar qué tipo de modelo es el que tenemos
para así poder seleccionar las fórmulas que se aplicaran a continuación.
Si la interacción entre las partes y los evaluadores es significativa entonces tenemos un modelo no aditivo o no
adicional. En cuyo caso aplican las fórmulas de la Tabla 14.

ja.cortes.052@gmail.com Página 15 de 21
Tabla 14. Fórmulas para el cálculo de varianzas estimadas y estimativos para un modelo no aditivo.1

Si la interacción entre las partes y evaluadores NO es significativa entonces tenemos un modelo aditivo o
adicional. En cuyo caso aplican las fórmulas de la Tabla 15.

SS POOL

SS POOL

Tabla 15. Fórmulas para el cálculo de varianzas estimadas y estimativos para un modelo aditivo.1
En el análisis del estimativo IAP que hace referencia a la interacción entre evaluadores y partes, encontramos para
este ejercicio que la interacción no es significativa y, por lo tanto, tenemos un modelo aditivo.
Para un modelo aditivo los componentes de varianza para cada fuente se determinan como sigue: A la suma de
cuadrados del error del equipo o gauge (SSE) se agrega a la suma de cuadrados de la interacción evaluador-parte
(IAP) el cual es igual a una nueva suma de cuadrados que llamaron suma de cuadrados acumulados o agrupados
(SSPOOL).
Las fórmulas por lo tanto quedan de la siguiente manera:

SSPOOL= SSE + SSAP (modelo aditivo)

Grados de libertad (GL) = nkr – n - k + 1


Donde n, k y r son valores ya conocidos n= número de partes, k= número de evaluadores, r= número de intentos.

Para calcular MSPOOL utilizamos la siguiente fórmula:

ja.cortes.052@gmail.com Página 16 de 21
Para ambos modelos, el aditivo y el no aditivo, se pueden aplicar las siguientes formulas solo teniendo en cuenta
que para el modelo aditivo la interacción operador parte es igual a cero:

Tabla 16. Fórmulas para el cálculo de varianzas estimadas que pueden aplicar a ambos modelos.

Ahora para calcular los estimativos del estudio por ANOVA realizaremos una tabla con el desglose de los
estimativos, varianzas estimadas, desviación estándar, porcentaje de variación debido a cada estimativo y el
porcentaje de contribución que se tiene de cada uno de ellos.
Iniciaremos con la varianza estimada del EV (equipment variation) y la fórmula mencionada en la Tabla 15:

SSPOOL= SSE + SSAP

2.7589 + 0.3590
0.039973
(10 * 3 * 3) - 10 -3 + 1

Calculemos como siguiente paso, la varianza estimada para los evaluadores AV (Appraiser Variation):

1.5836 - 0.039973 0.051455


10 * 3

Como se trata de un modelo aditivo, no hay interacción significativa entre evaluadores y partes, la varianza de IAP
es cero.

Seguimos con el cálculo de la varianza de RGG.

ja.cortes.052@gmail.com Página 17 de 21
= + + = 0.091429

Calculamos ahora la varianza de la parte.

9.8180- 0.03997 1.086447


3*3
A continuación, calculamos la variación total y los estimativos EV, AV, RRG, PV del estudio RyR utilizando las
fórmulas de la Tabla 15, donde la variación total es la raíz cuadrada de la suma de la varianza RGG y la varianza de la
parte. Los porcentajes de variación los obtenemos de dividir cada estimativo por el valor de la variación total
multiplicado por cien mientras que el porcentaje de contribución es similar solo que los valores tanto del estimativo
como el de la variación total van elevados al cuadrado. Con estos datos ya podemos crear la tabla de desglose de
variación y contribución que se muestra en la Tabla 15.

Estimativo de la varianza Desviación estandar 6σ % Variación Total % Contribución

= 0.039973
(Repetibilidad)
0.199933 EV = 1.1996 18.42 3.39

= 0.051455 0.226838 AV = 1.3610 20.90 4.37


 2
total  2 +  2 +  2 + 2
=(Reproducibilidad)
 repetibili
2
0.00= 
= dad
2

0.00 I AP = 0.0000 0.00 0.00


(Interaccción evaluador-parte)
 reproducib
2
ilidad =  + 
2 2

 repe
2
 2 +2 +  
/ repr == 0.09143 0.302372 RRG = 1.8142 27.86 7.76
(Repetibilidad y Reproducibilidad)

= 1.086447 1.042327 PV = 1.042327 96.04 92.24


(Parte)

Variación Total 1.08530 TV = 6.5118 100.00 100.00

Tabla 17. Porcentaje de variación y contribución del análisis ANOVA para un modelo sin interacciones.1

Para el cálculo del número de categorías distintas (ndc) que el sistema de medición puede discriminar,
utilizamos la misma fórmula del método largo cruzado X-R. Para el ndc no aplica la regla de redondear al entero
superior cuando las decimales den un valor mayor a 0.5, su valor es el resultado de redondear al entero inferior:

ja.cortes.052@gmail.com Página 18 de 21
Si hacemos un gráfico de barras de la variación total y de la contribución como se muestra en la Figura 9, podemos
observar que ambas son muy relevantes para entender el estudio.

Figura 10. Componentes de la variación del estudio de Repetibilidad y Reproducibilidad.

Es decir, en el cálculo de la variación total existe una relación entre los estimativos RRG y PV, denominador y
numerador, respectivamente. Esta relación indica que entre más alta sea la variación de la parte comparada con la
variación de la medición tendremos un mejor resultado en el de las categorías distintas ndc. Por lo tanto, para tener
un estudio confiable debemos garantizar que tengamos muestras en todo el rango de la tolerancia, lo que implica que
tomemos muestras variadas entre los límites de especificación o incluso un poco más allá de ambos límites para
garantizar esta variación.

Con toda esta información podemos decir que los métodos de promedios y rangos (X-R) y de ANOVA ofrecen
información relativa a las causas de variación de un proceso de medición, p.e.

Si la repetibilidad (EV) es grande comparada con la reproducibilidad (AV) las razones pueden ser:

• El instrumento necesita mantenimiento o una recalibración.


• El diseño del gage no es muy rígido y permite holguras o movimientos en la medición.
• La localización o sujeción del gage requiere de mejoras.
• Existe una variación excesiva de la parte.

Si es el caso contrario que la reproducibilidad (AV) es grande comparada con la repetibilidad (EV) las causas
pueden ser:
• El evaluador necesita ser mejor entrenado en cómo usar y leer el equipo de medición o el gage utilizado.
• Las calibraciones del gage o equipo no son claras o confiables.
• El dispositivo puede requerir la ayuda del evaluador para ser más consistente.

ja.cortes.052@gmail.com Página 19 de 21
Si comparamos los resultados de % de variación total del método X-R y los que calculamos por el método por
ANOVA tendremos la siguiente tabla de estimativos:

% de variación total
Concepto Estimativo
X-R ANOVA
Repetibilidad EV 17.61 18.42
Reproducibilidad AV 20.04 20.90
Interacción Ev-Pt IAP N/A 0.00
Repetibilidad y Reproducibilidad RRG 26.68 27.86
Variación de la parte PV 96.38 96.04
Número de categorías distintas ndc 5 4

…...Tabla 18. Comparación de los resultados de los estimativos de un estudio RyR por X-R y por ANOVA.

Los resultados muestran un menor porcentaje de variación total y un ndc más alto utilizando el método X-R. Esto
indica que el ANOVA, al ser un método anidado, los resultados del evaluador y la parte no presentan una interrelación
que deba tomarse en cuenta ya que para este ejercicio la interacción no es significativa. Referente al ndc, el valor
obtenido por ANOVA es más bajo que el que recomienda el manual del AIAG, sin embargo, al ser un método más
preciso, dependerá del representante autorizado del cliente si acepta el resultado del estudio. Con respecto al
estimativo IAP, el método X-R no lo calcula y por tanto no aplica, mientras que en el ANOVA obtuvimos un valor igual
a cero.

CONCLUSIONES Y RECOMENDACIONES

El resultado de la medición es muy importante ya que un error en su obtención podría afectar la funcionalidad de
las piezas producidas que reciba el cliente.

El estudio de Repetibilidad y Reproducibilidad por ANOVA es más preciso que un estudio X-R, y nos permite
distinguir si existe una interacción entre los evaluadores y las partes cuando tenemos pruebas destructivas o no
repetibles, donde se requiere saber si existe una influencia del evaluador al medir las partes y determinar si es
necesario ajustar o cambiar el proceso de medición o la interpretación individual que puedan tener los evaluadores.

Se debe llevar a cabo un entrenamiento robusto y efectivo para los evaluadores antes de hacer un estudio RyR,
asegurando que entienden todos los pasos del proceso de medición junto con una correcta utilización del equipo o
gage empleado. Sin embargo también puede usarse como un método de diagnóstico del sistema de medición para
detectar las necesidades de capacitación del personal.

Es crítico seleccionar un rango de trabajo lo suficientemente amplio para las partes, que incluya los límites reales
del proceso productivo, así como un debido estudio aleatorio para obtener un buen resultado.

Cuando se usa para pruebas destructivas o no repetibles, se debe contar con suficientes partes de lotes similares
para crear grupos donde puedan distinguirse la variación de la parte a través del todo el rango de trabajo.

Los métodos analizados de RyR para variables no son los únicos y existen otros como la estabilidad, el sesgo, la
linealidad, etc., por lo que antes de iniciar un estudio se debe revisar cuál es el método adecuado de acuerdo con el
tipo de medición, ya que recordemos que el objetivo de este tipo de estudios es demostrar que nuestros procesos de
medición son confiables y poder demostrarlo a través del análisis del sistema de medición.

ja.cortes.052@gmail.com Página 20 de 21
Estos métodos no son exclusivos de la industria automotriz y pueden aplicarse a cualquier proceso de medición.

BIBLIOGRAFIA CONSULTADA

1. Chrysler Corporation, Ford Company, and General Motors Corporation, 2010. Measurement Systems Analysis
(MSA) -Reference Manual. 4th ed. Southfield, MI: AIAG (Automotive Industry Action Group).
2. Bevilacqua M, Ciarapica FE, Giacchetta G, Marchetti B, Overview on the application of ISO/TS 16949:2009, in
a worldwide leader company in the production of stainless steel tubes for automotive exhaust systems, Int. J.
of Productivity and Quality Management 2011, 7(4), 410-39.
3. García H. 2008. Análisis de los Sistemas de Medición (MSA), Puebla, MX: Instituto para Formación y Desarrollo
Volkswagen.
4. American Society for Quality, About Gage Repeatabilty and Reproducibility, SQA 2020, https://asq.org/quality-
resources/gage-repeatability.
5. Bass I. Six Sigma Statistics with Excel and Minitab, NY, US: McGraw Hill; 2007.
6. Perez-Wilson M. Gauge R&R Studies for destructive and non-destructive testing, Arizona, US: Advanced
Systems Consultants; 2003.
7. Gutierrez H, De la Vara R. Control Estadístico de Calidad y Seis Sigma, México DF, MX: McGraw Hill; 2013.

ACERCA DEL AUTOR:

Jaime Cortés R. es Ingeniero Químico egresado de la Universidad Autónoma de Puebla con 29 años de trabajo
en la industria, es Black Belt y ha dirigido varios proyectos de Six Sigma, ha impartido 3 diplomados de Core
Tools en la Benemérita Universidad Autónoma de Puebla, es instructor y consultor para empresas de cursos de
control estadístico de procesos y de análisis de sistemas de medición, actualmente se desempeña como Launch
Manager en una empresa automotriz de autopartes plásticas T1 y T2.

ja.cortes.052@gmail.com Página 21 de 21

También podría gustarte