Está en la página 1de 7

UNIVERSIDAD NACIONAL MAYOR DE SAN MARCOS

FACULTAD DE CIENCIAS MATEMÁTICAS


E.A.P. DE ESTADÍSTICA

Métodos multivariantes en control estadístico de la


calidad
Capítulo III. Gráficos de control T2 de Hotelling

TRABAJO MONOGRÁFICO
Para optar el Título Profesional de Licenciado en Estadística

AUTOR

Anchiraico Agudo, William Richard

LIMA – PERÚ
2003
CAPITULO III
GRAFICO DE CONTROL T2 DE HOTELLING
CAP. III GRAFICO DE CONTROL T2 DE HOTELLING

El gráfico T2 de Hotelling se puede considerar como la extensión multivariante del


gráfico de control Shewhart univariante. El estadístico T2 es un escalar que combina
información para la dispersión y media de las variables que estamos analizando. Si
asumimos una distribución normal multivariante y se conocen los verdaderos
parámetros de la distribución, es decir, conocemos el vector de medias y la matriz de
varianzas y covarianzas, el estadístico T2 sigue una distribución chi-cuadrado. En el
caso bivariante, este estadístico tendría la siguiente forma:

x02 =
n
σ σ − σ 12
2 2 2
[
σ 22 ( x1 − µ1 ) 2 + σ 12 ( x2 − µ 2 ) 2 − 2σ 12 ( x1 − µ1 )( x2 − µ 2 ) ]
1 2

donde x1 y x2 son las medias muéstrales de las respectivas variables, µ1 y µ 2 sus


medias poblacionales,σ 1 y σ 2 las desviaciones típicas yσ 12 es la covarianza. Si
estamos analizando más de dos variables, el estadístico chi-cuadrado toma la siguiente
forma:
x02 = n( xi − µ ) r ∑ −1 ( xi − µ ) ..................................................(3.1)

donde µ es el vector de medias, ∑ es la matriz de varianzas y covarianzas y “n” es el


tamaño muestral. El límite superior de control se va a situar para un nivel de
significación dado por X (2n , p ) , y el límite inferior está situado en cero, ya que el

estadístico es no negativo.
Cuando los valores poblacionales no son conocidos, es necesaria su estimación, dando
origen al gráfico T2 de Hotelling. Con p variables y m muestras de tamaño n, la media y
cuasivarianza muestral se calculan como:

1 k  j = 1,2,....., p 
x jk = ∑ xijk 
n i =1 k = 1,2,...., m 

....................(3.2)
1 k  j = 1,2,....., p 
S 2jk = ∑ ( xijk − xijk ) 2  
n − 1 i =1 k = 1,2,......, m

27
donde xijk es la i-ésima observación en la j-ésima característica de calida en la muestra k.
La cuasicovarianza entre dos características de calidad j y h se calcula para la muestra k
como:
1 k k = 1,2,...., m
S ijhk = ∑ ( xijk − x jk )( xihk − x hk ) ............(3.3)
n − 1 i =1 j ≠ h

Con las expresiones anteriores podemos determinar la media y varianza para las m
muestras y para las variables a través de las expresiones:

1 m
x= ∑ x jk
m k −1 j = 1,2,....., p

1 m 2
S 2j = ∑ S jk
m k −1
j = 1,2,....., p ....................(3.4)

1 m
S jk = ∑ S jhk
m k −1
j≠h

Sustituyendo en la expresión (3.1), el estadístico T2 queda:

= =
2
Ti = n ( xi − x) r S −1 ( xi − x) .......................................(3.5)

Para datos agrupados, el estadístico T2 sigue una distribución F de Snedecor, por lo que
los límites de control bajo los supuestos usuales van a venir dados como:

p (m − 1)(n − 1)
LSC = Fα , p ,mn − m − p +1
mn − m − p + 1
....................(3.6)
LIC = 0
Así, podemos analizar si el proceso se encuentra bajo control mediante la representación
de los valores T2 junto a dicho límite de control. Cuando el valor T2 para todas las
muestras sea inferior al LSC, el proceso se considera bajo control y, en caso contrario,
que existe una anomalía que nos lleva a una situación fuera de control.

28
Si bien la interpretación de los resultados era bastante sencilla en el caso univariante, en
el caso multivariante la interpretación de estas señales fuera de control va a ser más
compleja. El fin que perseguimos es detectar situaciones en las que el proceso presenta
cambios moderados y una vez detectadas, determinar sus causas.
En las técnicas multivariantes, determinar esa situación fuera de control es
relativamente fácil, ya que el análisis es similar al caso univariante; pero determinar las
causas que han provocado ese cambio será más complicado. Se han desarrollado
algunas técnicas para ayudar en la interpretación de esas señales fuera de control, si
bien, las más utilizada consiste en analizar gráficos de control univariantes
correspondientes a cada una de las características de calidad y así intentar determinar
qué característica de calidad provoca esa situación. Este camino presenta ciertos
inconvenientes; el primero es que hay muchas variables y estas técnicas tienden a ser
tediosas por la cantidad de gráficos de control que analizar. La segunda, más
importante, es que normalmente una señal fuera de control no es causada por una
variable, sino más bien por la interacción entre varias variables.
Así por ejemplo, si estamos analizando dos características de calidad con una alta
correlación positiva, debemos suponer que las medias en cada muestra para cada una de
las características deben tener una relación parecida, si no igual, respecto a la media del

proceso ( x ) para cada variable. Es decir, si la media de la primera variable en una


muestra supera a la media de dicha variable para el conjunto del proceso, debemos
esperar que en esa muestra, la media de la segunda variable también exceda a su media
global. Si se observan movimientos en distinta dirección vamos a sospechar que el
proceso probablemente se encuentre en una situación fuera de control, ya qué habrá
cambiado la correlación entre las variables. Esta anomalía no se detectaría con gráficos
univariantes ya que no es debida a ninguna de las variables consideradas
individualmente sino a la relación existente entre ellas. Si las dos desviaciones son en la
misma dirección y una es mayor, esta situación se reflejara en el gráfico multivariante
como una situación fuera de control y si analizamos los correspondientes gráficos
univariantes podremos determinar a que variable es debida esa situación.
Por lo tanto hay que desarrollar otra alternativa que sea más efectiva que el análisis
univariante. En este sentido, Alt (1985) desarrolló gráficos de medias individuales con
un control tipo Bonferroni que consiste básicamente sustituir en los límites de control
establecidos para dichos gráficos Z α 2 por Z α 2 P lo que nos va a permitir reducir el

29
número de falsas alarmas que ocurren cuando utilizamos simultáneamente muchos
gráficos de control univariantes.
Hayter y Tsui (1994) utilizaron un procedimiento de intervalos de confianza
simultáneos tipo Bonferroni para cada una de las características de calidad. Estos
intervalos de confianza son esencialmente unos sustitutos de los gráficos de control de
media individuales y suelen ser más efectivos en la identificación de la característica de
calidad que causa la señal fuera de control en los gráficos multivariantes. La idea
general es construir p intervalos (uno para cada característica de calidad) para cada
muestra que produce una señal fuera de control en el gráfico de control multivariante.
Este intervalo para el subgrupo j-ésimo y la característica de calidad i-ésima tendrá la
siguiente forma:

m −1 ϖ m −1
xi − t α n ( n −1)
S pi ≤ xi ≤ xi + t α n ( n −1) S pi .......................(3.7)
2p mn 2p mn

donde:

• xi es la media de la característica de calidad i-ésima para el conjunto del proceso.

• S pi es la cuasidesviación típica muestral para la característica i-ésima.

• “m” es el número de muestras que tenemos y “n” es el tamaño de cada muestra.


ϖ
• xi es la media de la característica i-ésima en la muestra j-ésima en la que se ha
detectado una situación fuera de control.

Si el valor de la media de la variable en esa muestra no se encuentra dentro de ese


intervalo, entonces el valor de la característica de calidad debe ser investigado para las
m muestras. Si se detecta una causa asignable, la muestra debe ser eliminada para todas
las variables y habrá que volver a calcular el límite superior de control correspondiente.
El problema de este procedimiento aparece a la hora de determinar el nivel de
significación que vamos a utilizar para esos intervalos de confianza. Cuando el número
de variables que manejamos no es muy elevado, es conveniente utilizar un nivel de
confianza de 0,01. Si la media muestral no se sale de ningún intervalo habrá que
sospechar que el motivo de la variación esta en la estructura de correlación de las
variables.

30
Otro procedimiento para interpretar esas señales fuera de control consiste en la
descomposición del estadístico T2 de forma que nos mida la influencia de cada una de
las variables. Si T2 es el valor del estadístico, y T2(i ) es su valor para todas las variables
del proceso excepto la i-ésima, podemos calcular un indicador de la contribución de la
variable i-ésima sobre el conjunto de la siguiente forma:

d i = T 2 − T 2 (i )

Cuando aparece una situación fuera de control en un gráfico de control multivariante es


conveniente calcular esta contribución para cada una de las variables y centrar nuestra
atención en aquellas variables cuya contribución sea superior.
Existen también otras técnicas, menos usuales en la práctica, para interpretar la señal de
fuera de control. Por ejemplo, Jackson (1980) propone una basada en representar
componentes principales en lugar de las variables originales, con el posible problema de
interpretación de esos resultados cuando no sea fácil encontrar el significado de dichas
componentes. Murphy (1987) recomienda un método que consiste en desarrollar un
procedimiento basado en un análisis discriminatorio que nos permite agrupar las
observaciones en grupos; y en Mason, Tracy y Young (1996) se propone una
descomposición del estadístico T2 de una forma más compleja que la anterior.
Por lo tanto es conveniente no utilizar estas técnicas de control multivariantes de forma
aislada sino más bien complementadas por alguna de estas técnicas de análisis de
señales fuera de control descritas que nos van a permitir una interpretación más clara de
los resultados obtenidos.
Este gráfico, igual que el Shewhart univariante, es sensible a grandes cambios en los
datos, pero cuando la salida de control provoca una acumulación de variaciones de
magnitud moderada, esta técnica no es eficaz. Habría que recurrir a la extensión
multivariante de otras técnicas de control desarrolladas para solucionar este mismo
problema en el caso univariante.
Dentro de éstas cabe destacar lo que se conoce como MCUSUM y MEWMA, que son la
extensión multivariante de los gráficos de control CUSUM y MEWMA
respectivamente.

31

También podría gustarte