Está en la página 1de 15

Control

Estadístico
multivariado
Este capítulo se presentara algunas propuestas de las herramientas de
control estadístico multivariado, l caso la carta multivariada de Shewhart y
el Índice de capacidad de Boyle
CARTA DE
CONTROL DE
SHEWHART
MULTIVARIADO
Durante la Segunda Guerra Mundial la técnica estadística de
CARTA DE CONTROL univariadas fue la más utilizada a
pesar de que los procesos y productos que se analizaban
poseían en su gran mayoría dos o más características de
calidad. Por lo que se hizo necesario aplicar herramientas
estadísticas multivariadas para su control.

Sin embargo las técnicas multivariadas de control son


técnicas muy complejas de utilizar, por los conceptos
matemáticos que se manejan. Dificultad que se supero con el
avance de los de los programas de control estadístico, por lo
que en estos momentos el interés de las técnicas de control
multivariado a crecido vertiginosamente.

IMPORTANCIA DE LAS CARTA DE CONTROL


MULTIVARIADO

La técnica de la gráfica de control multivariado se elabora


para determinar especialmente cuatro importantes
propiedades como son:
1. Determinar si el proceso se encentra o no en control.
2. Mantener constante el error tipo I o nivel de significancia
α.
3. Con este tipo de herramienta se puede determinar el tipo
de relación existente entre las variables involucradas en le
proceso.
4. Si el proceso está “fuera de control” ¿cuál es la variable
que causo dicho inconveniente?

PROCEDIMEINTO PARA LA ELABORACION DE UN CARTA


DE CONTROL MULTIVARIADO

Se tomara como supuesto estadístico de que el proceso esta


bajo control y cada una de las variables se encuentran
normalmente N ~ (µ , σ 2 ) distribuidas y en forma
independiente, en donde el error tipo I o nivel de significancia
α , es el establecido en forma diferente al CARTA DE
CONTROL univariado. Por ejemplo si se tomo el nivel de
significancia de 0.05 para una gráfica de control univariado,
en el caso multivariado se establecería de la siguiente
manera: tomando como ejemplo dos variables
2
1 − 0.95 = 0.0975 ≈ 0.1

Para la elaboración de las CARTA DE CONTROL


multivariadas la técnica más aplicada es la propuesta por
Hotelling conocida como la T 2 . Esta es una generalización de
la estadística t de Students y toma la forma de:

T 2 = ( x J − M ) ' V −1 ( x J − M )

Donde xJ es la columna de vectores que representan las


2
variables y V es la matriz de covarianzas. La distribución T
fue propuesta por Hotelling en 1931 y es una función del
número de variables p , el tamaño de los subgrupos n , M
son los valores de las medias de referencia para cada
variable M = m1 , m2, ...mp y la cantidad de subgrupos g , usadas
en la estimación de la covarianza.

2
La distribución T está relacionada con la conocida
distribución F mediante las siguientes formulaciones:

Para tamaños de subgrupos n > 1

p ( g + 1)( n + 1)
T 2 p , n ,α = Fα , ( g , gp − g − p +1)
( gn − g − p + 1)

Cuando son observaciones individuales, es decir n =1 las


formulas aplicadas son las siguientes:

gp
T 2 p , g ,α = Fα , ( p , g − P +1)
( g − p + 1)

Propuesta por Edgar Jackson, 1985 y la fórmula aplicada por


T.P. Ryan, 1988:

p ( g + 1)( g − 1)
T 2 p , n ,α = Fα ,( g , g − p )
g ( g − p)

2
Lo cual implica que este valor T p ,n ,α , se toma como el límite
de control superior para la media en la CARTA DE CONTROL
de control multivariado.
Un ejemplo en donde se establece dos variables, en este
caso un fertilizante compuesto, y un tamaño de muestra n = 1 .
Para ello se utilizo la formula de T.P. Ryan para evaluar el
límite superior de control. A continuación presentamos la
información obtenida de 10 subgrupos:

Subgrupo Nitrógeno Fósforo


1 14.6116 14.7818
2 14.8443 14.9808
3 14.1500 15.1454
4 15.2383 15.0983
5 14.3040 14.5420
6 14.9958 15.0166
7 14.5151 14.3225
8 14.7225 14.5275
9 14.4366 14.3992
10 15.2640 15.5858
x1 = 14.7083 x2 = 14.84201
s = 0.37804 s = 0.3970

SUBGRUPOS PARA
CONTROL
14.3500 14.6040
14.9742 15.1060
14.8650 15.0641
14.3675 14.5660
x1 = 14.639 x2 = 14.835
La matriz de varianza covarianza está definida de la siguiente

 =  
manera,

En el ejemplo tenemos,

14.6116 14.8443 14.1500 15.2383 14.3040 14.9958 14.5151 14.7225 14.4366 15.2640
14.7818 14.9808 15.1454 15.0983 14.5420 15.0166 14.3225 14.5275 14.3992 15.5858

14.6116 14.7818
14.8443 14.9808
14.1500 15.1454
15.2383 15.0983
14.3040 14.5420
14.9958 15.0166
14.5151 14.3225
14.7225 14.5275
14.4366 14.3992
15.2640 15.5858
Esta matriz se centra tomando cada valor y restando el

nitrógeno es 14,6116 − 14,7083 = −0,09662


promedio para cada una de las variables, por ejemplo para el

-0,09662 0,13608 -0,55822 0,53008 -0,40422 0,28758 -0,19312 0,01428 -0,27162 0,55578

×
-0,05819 0,14081 0,30541 0,25831 -0,29799 0,17661 -0,51749 -0,31249 -0,44079 0,74581

-0,097 -0,06
0,136 0,14
-0,558 0,31
0,530 0,26
-0,404 -0,30
0,288 0,18
-0,193 -0,52
0,014 -0,31
-0,272 -0,44
0,556 0,75

 0.1491 0.0895
=  
0.0895 0.1577
La matriz de covarianza obtenida de la anterior información
es la siguiente:

 0.1491 0.0895
V = 
0.0895 0.1577

Donde la inversa de dicha matriz es:

 10.1667 − 5.7675
V −1 =  
− 5.7675 9.6136 

En el caso de tres variables la matriz de varianza covarianza


estándar es de la forma,

 ( ,  ) ( ,  )


( ,  )  ( ,  )
( ,  ) ( ,  ) 

El coeficiente de correlación está definido, para el caso de las


variables

( ,  )
=
 

−5,7675
= = −0.58
√10,1667 × 9,6136
En este ejemplo existen dos variables p = 2 , la cantidad de
subgrupos g = 10 , y el tamaño del subgrupo n = 1 , para un nivel
de significancia α = 0.05 .

El límite de control superior es calculado de la siguiente


manera:

El valor F de Fisher es F0.05 (10 , 8) = 3.347 . Por lo tanto el valor


de T2 :

( 2)(11)(9)
T 2 0.05 (10 , 8 ) = 3.347 = 8.284
(10)(10 − 2)

Este valor del estadístico T 2 que se toma como el límite


superior de control es comparado con cada par de
observaciones. Por ejemplo tomemos el cuarto subgrupo en
donde el par de observaciones para el nitrógeno y el fósforo
es respectivamente 15.2383 y 15.0983.

Como se trata de observaciones individuales el de la T 2 se


determina de la siguiente forma (e.g ver E. Jackson, 1985)

T 2 = ( xJ − x )'V −1 ( xJ − x )

(x j − x )' = [15.238 − 14.708 15.098 − 14.84 2]

 10.1667 − 5.7675 
V −1 =  
− 5.7675 9.6136 

15.238 − 14.708
(x j − x ) =  
15.098 − 14.842
 10.1667 − 5.7675 15.238 − 14.708
[15.238 − 14.708 15.098 − 14.84 2]   = 1.9162
− 5.7675 9.6136  15.098 − 14.842

El valor de T 2 j = 1.9162 . Calculando los valores de todos los


subgrupos, encontramos que el proceso se encuentra bajo
control estadístico, ver figura 1.

CARTA DE CONTROL de Control Multivariado.

0
0 2 4 6 8 10 12

El vector de medias es de la forma,


&
$=% : )
&(

En este ejemplo se tiene que

14,7083
$=* +
14,8420
EVALUACIONES DE LAS MEDIDAS DE VARIABILIDAD

Cuando hay g subgrupos de tamaño n > 1 , los (i, i )


,

elementos de la matriz de covarianzas de medias V es


estimada de la siguiente forma:

n∑ j ∑ l ( xijl − xij )( xi , jl − xij )


Vii , =
[g (n − 1)]
En donde i son las variables o característica de calidad, j los
subgrupos y l las observaciones sobre las i variables.

Para un tamaño de subgrupo n = 1 , la estimación de la matriz


de covarianza posee la siguiente formulación:

Vii , =
∑ j ( xij − xi )( xi ' jl − xi ' )
( g − 1)

La suma de la estadística T 2 de las observaciones en los j


subgrupos (T 2 je , l = 1,..n) (e.g. ver Camil Fuchs y Yoav
Benjamine, 1994) puede descomponerse en dos términos:

1 1
∑ (xkj − M),V −1(xkj − M) =∑ (xj − M),V −1(xkj − M) + ∑ (xje − xj ) `V −1(xkj − xj )
n n
o

∑T 2
je
= T 2 j + T 2 Dj
Donde ∑ l T 2 je representa la medida de la variabilidad total del
proceso, T 2 j la distancia entre las medias de los subgrupos y
T 2 Dj una medida generalizada de la dispersión del subgrupo
alrededor de su media.

En el ejemplo anterior agreguemos cuatro grupo de


observaciones: A = (14.350, 14.604), B = (14.974,15.106), C
= (14.865, 15.064) y D = (14.367,14.566) cuyos valores del
2
estadístico T son respectivamente: 0.86, 0.5825, 0.3269 y
0.8274. La suma de estos valores es denotada por T 2 je = 2.598
2
y tiene una distribución asintótica χ con mp grados de
libertad. En este caso 4(2) = 8, para un nivel de significancia
del 5% sería de 15.5, por lo tanto concluimos que la
variabilidad de esta muestra no es significativa.

Posteriormente obtenemos el promedio de esta muestra. Esto


es, 14.639 para el nitrógeno y 14.835 para el fósforo.
Aplicando la fórmula T 2 y multiplicando por m como sigue:

T 2 j = m( xJ − M )'V −1 ( xJ − M )

( x j − x )' = [14.639 − 14.708 14.835 − 14.84 2]

−1  10.1667 − 5.7675
V = 
 − 5. 7675 9 .6136 

14.639 − 14.708
(x j − x) =  
14.835 − 14.842
 
T 2 j , tiene la misma distribución como T2 con los mismos
límites. En este caso, el valor es de
T 2 j = (4)(0.0450) = 0.18 . Por lo tanto la media de esta
muestra, no es significativa con respecto a la muestra
original.

2 2 2
La diferencia T je − T j = T Dj tiene una distribución
asintótica con (m − 1) p grados de libertad, en este caso es
igual a seis (6), con un nivel de significancia α del 5% cuyo
valor es 12.59 y la diferencia obtenida es de
T 2 je − T 2 j = 2.598 − 0.18 = T 2 Dj que es un valor no
significativo.

INDICE DE
CAPACIDAD
MULTIVARIADO
Para calcular el índice de capacidad para un proceso que
cuenta con v variables Bothe considera una manera simple
de hacerlo es tomando el porcentaje mínimo de no conformes
de cada una de las características P1, P2, . . . , Pν . Por lo
que en todo el proceso la medida mínima es P=
min{P1, P2, . . . , Pν }. Suponga que las características son
cinco (ν = 5), con igual porcentaje de no conformes P1 = P2 =
P3 = P4 = P5 = 99.73%. Aplicando la formulación de Bothe
entonces el porcentaje del proceso es P = min{P1, P2, P3,
P4, P5} = 99.73% (o 2700 ppm de no conformes). Asumiendo
que las características son independientes, el rendimiento del
proceso es P = P1 × P2 × · · ·×P5 = 98.66% (or 134 273 ppm
de no conformes), que es significativamente menor al
calculado por Bothe, usando la propuesta el índice de
capacidad multivariado se toma la siguiente formulación,

1 0 2∏85942∅43,(-5 6 − 16 + 1:
,(-
.
= ∅ 1 ;
3 2

Donde Cpkj denota el índice de capacidad de cada


característica de calidad, Cpk es el índice de capacidad
global de las j = 1, 2, . . . , ν características, siendo v es el
número e características de calidad.

<=>? @ Rendimiento del Proceso

1.00 0.9973002
1.24 0.9998007
1.33 0.9999339
1.50 0.9999932
1.67 0.9999994
2.00 0.9999999

1 0 2∏85942∅43,(-5 6 − 16 + 1:
∅ 1 ;=A
3 2
G

B24C∅4D<=>? 6 − E6 + E: = CF(DA) − E
?9E
G G

H = B H? = B24C∅4D<=>? 6 − E6 + E: = CF4D<=>? @ 6 − E
?9E ?9E

La propuesta de Chan es la siguiente,

8
1
I(. = ∅0 JB(K)L
3
59

Donde P es la probabilidad de cumplir con las

proceso poseen una distribución normal M~(O, PC ). Esta


especificaciones, considerando que las observaciones del

probabilidad está definida como,

8 8

K = JB Q(RST ≤  ≤ RS,)5 L = JB Q(VW ≤ X ≤ VY )5 L


59 59
Por ejemplo,

LES NOMINAL LEI


FIC-6A01 3392,20 3347,96 3303,72
LIC-6A01 49,10 47,92 46,75

RMOLAR 2,04 2,01 1,98

TIC-6A01 57,31 56,66 56,01

DIC-6A01 25,48 19,65 13,82

TIC-6A08 99,70 98,37 97,03

FIC-6B01 675,68 653,77 631,87

TIC-6B02 62,68 62,14 61,61

TIC-6B17 98,36 97,68 97,00

TIC-6B10 101,70 101,16 100,62

FIC-6B02 535,15 519,29 503,43

FIC-6B03 465,11 443,77 422,43

ÍNDICES DE CAPACIDAD UNIVARIADO

VARIABLE
Cp Cpk s Cpk i Cpk Cpm

FIC-6A01 0,31225 0,410011 0,409916 0,409916 0,296736

LIC-6A01 0,31154 0,408327 0,409081 0,408327 0,295738

R.MOLAR 0,35160 0.365365 0.337828 0.337828 0.339175

TIC-6A01 0,31643 0.317489 0.315378 0.315378 0.293271

DIC-6A01 0,30854 0,413574 0,413375 0,413375 0,296096

TIC-6A08 0,31785 0.317768 0.317935 0.317768 0.298076

FIC-6B01 0,30761 0,405421 0,405537 0,405421 0,294872

TIC-6B02 0,31547 0.315634 0.315306 0.315306 0.293288

TIC-6B17 0,31605 0.31594 0.316165 0.31594 0.29721

TIC-6B10 0,31642 0.318475 0.314356 0.314356 0.299088

FIC-6B02 0,28128 0,427639 0,427658 0,427639 0,281282

FIC-6B03 0,30848 0.375451 0.375366 0.375366 0,308478

También podría gustarte