Documentos de Académico
Documentos de Profesional
Documentos de Cultura
+ c
]
j = N de observaciones, desde 1 hasta r repeticiones: j=1,2.....r
i = N de niveles, desde 1 hasta a: i = 1,2.....a
Donde:
y
]
= observacin o respuesta (i=N de nivel; j=N de repeticin del nivel i).
p = valor promedio general.
D
u
=1
= u).
x La suma de todos los errores es 0: _ _ c
]
= u
u
=1
]=1
x Los errores son independientes y uniformemente distribuidos (IID).
x Los errores tienen una distribucin normal.
Este modelo explica las variaciones dentro de un mismo grupo (errores) y las variaciones entre los
grupos (efectos del factor).
En la siguiente tabla se generalizan los valores de las variables de respuestas de todas las corridas.
Las ltimas dos columnas incluyen la suma total de cada tratamiento y el promedio
correspondiente.
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 12 de 50
Repeticiones Suma total
de cada fila
Promedio de
cada fila
1 2 . j . R
y
]
]=1
y
t.
= y
|
r /
1 y
11
y
12
. y
1j
. y
1r
y
1.
y
1.
2 y
21
y
22
. y
2j
. y
2r
y
2.
y
2.
. . . . . . . . .
i y
i1
y
i2
y
ij
. y
ir
y
i.
y
i.
. . . . . . . . .
a y
a1
y
a2
. y
aj
. y
ar
y
a.
y
a.
Tabla: esquema general de las observaciones.
N total de observaciones = N = ra.
Estimacin de los trminos del modelo estadstico de la respuesta
Estimacin de la Media
El nmero total de observaciones es la suma de todas las observaciones:
y
]
u
=1
]=1
= (p + D
+ c
]
u
=1
]=1
) =
= p
u
=1
]=1
+ D
u
=1
]=1
+ c
]
u
=1
]=1
=
= rop + r D
u
=1
+c
]
u
=1
]=1
Entonces si por hiptesis _ D
u
=1
= u y no hay errores significativos o sea _ _ c
]
u
=1
]=1
= u, la
ecuacin se transforma en:
y
]
u
=1
]=1
= rop
p =
1
ro
y
]
u
=1
]=1
Como N = ro, entonces:
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 13 de 50
p =
1
N
y
]
u
=1
]=1
= y
..
Estimacin de los Efectos
El efecto del factor se refiere a la influencia que tiene el factor A en el nivel i sobre la respuesta
para cada tratamiento.
Para el clculo de los efectos de cada nivel, se considera el promedio por nivel i:
y
i.
=
1
r
y
]
]=1
y
i.
=
1
r
(p + D
+ c
]
)
]=1
=
1
r
rp +
1
r
rD
+
1
r
c
]
]=1
Por hiptesis:
x La suma de todos los errores es 0 = _ _ c
]
u
=1
]=1
.
Entonces la expresin final se simplifica como:
y
i.
= p + D
Y se obtiene el efecto del nivel i del factor:
D
= y
i.
- p
Estimacin del Error
La estimacin del error experimental se realiza con la diferencia entre la observacin y el promedio
del grupo de observaciones:
c
]
= y
]
- p - D
Una medida general del error del experimento se realiza con la suma de los cuadrados del error
(Sum Of Square Errors o SSE).
SSE = c
]
2
u
=1
]=1
De esta forma se estiman los trminos del modelo estadstico de respuesta (P, D
i
y e
ij
)
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 14 de 50
Asignacin de la Variacin
La variacin de la respuesta puede deberse al efecto del factor o al efecto del error. En este caso se
utiliza como expresin de la variacin a la suma de cuadrados SS. Entonces la suma de cuadrados
totales incluye a la suma de cuadrados de trminos del factor, SSA, y a la suma de cuadrados del
error SSE.
Para averiguar el origen de la variacin se comienza por expresar el cuadrado de la respuesta:
y
]
2
= ( p + D
+ c
]
)
2
Desarrollando el cuadrado de la suma se tiene:
y
]
2
= p
2
+ D
2
+ c
]
2
+ 2pD
+ 2pc
]
+2D
c
]
Distribuyendo la doble sumatoria a cada uno de los trminos la ecuacin es:
y
]
2
,]
= p
2
u
=1
]=1
+ D
2
u
=1
]=1
+ c
]
2
u
=1
]=1
+ 2pD
u
=1
]=1
+ 2pc
]
u
=1
]=1
+ 2D
c
]
u
=1
]=1
Pero en los productos cruzados se aplican las hiptesis:
o
u
=1
= u
c
]
u
=1
]=1
= u
Por lo tanto:
2pD
u
=1
]=1
= 2pc
]
u
=1
]=1
= 2D
c
]
u
=1
]=1
= u
Y la expresin anterior resulta:
y
]
2
u
=1
]=1
= p
2
u
=1
]=1
+ D
2
u
=1
]=1
+ c
]
2
u
=1
]=1
O en trminos de suma de cuadrados:
SSY = SSO + SSA + SSE
Entonces:
Variacin total (SST)
Variacin entre grupos (SSA) Variacin dentro del grupo (SSE)
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 15 de 50
SS0 = p
2
u
=1
]=1
= orp
2
SSA = D
2
u
=1
]=1
= r D
2
u
=1
La variacin total SST se expresa como
SSI = (y
]
- y
..
)
2
u
=1
]=1
= SS - SS0 = SSA + SSE
(y
]
- y
..
)
2
u
=1
]=1
= (y
]
2
- 2y
]
y
..
+y
..
2
)
u
=1
]=1
=_ _ y
]
2
-
u
=1
]=1
_ _ 2y
]
y
..
+
u
=1
]=1
_ _ y
..
2 u
=1
]=1
y
..
=
_ _ y
]
u
=1
]=1
or
y
]
= or y
..
u
=1
]=1
Reemplazando en el segundo trmino, se obtiene
SSY - SSu = _ _ y
]
2
-
u
=1
]=1
_ _ 2ory
..
2 u
=1
]=1
+_ _ y
..
2 u
=1
]=1
=_ _ y
]
2
-
u
=1
]=1
_ _ ory
..
2 u
=1
]=1
SSY SS0=_ _ y
]
2
-
u
=1
]=1
o
2
r
2
y
..
2
Las variaciones porcentuales por el factor se expresan como:
SSA
SST
x 1
Las variaciones por el error se expresan como:
SSE
SST
x 1
Segn el valor porcentual de cada componente se puede apreciar el impacto en la variable de
respuesta, aunque se requiere de un mtodo estadstico para mayor precisin en los resultados.
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 16 de 50
Anlisis de Variancia
El mtodo estadstico para analizar la significancia estadstica de varios factores se llama ANALISIS
DE VARIANCIA (ANAVA) o Analysis of Variance (ANOVA).
En el ANOVA se plantea la hiptesis nula H
0
indica que todas las muestras (corridas con cada nivel
del factor) tienen la misma media:
P
1
=P
2
=P
3
=.=P
a
=P
Otra forma de expresar la H0 es que los efectos del factor son cero:
D
1
= D
2
=D
3
..=D
a
= 0
La hiptesis alternativa H
1
indica que al menos un nivel del factor produce un efecto distinto de cero
(D
i
0)
o que al menos una de las muestras tiene una media distinta (P
i
P).
Para comprobar la H0 se consideran las sumas de cuadrados SSY, SSO, SSA y SSE y sus grados de
libertad asociados (nmero de variables independientes requeridas para calcular cada trmino (SS)).
x SSY tiene or grados de libertad porque tiene or trminos, todos pueden ser elegidos
independientemente.
x SS0 tiene un grado de libertad, es un trmino simple
2
, constante, que se repite or veces.
x SSA tiene (o - 1) grados de libertad, la suma de cuadrados tiene a trminos, pero como
hay una ecuacin adicional (la suma de todos los efectos es cero) entonces se reduce en 1 los
a grados de libertad.
x SSE consiste en ar trminos de los cuales solo a(r-1) son independientes porque los r errores
correspondientes a r repeticiones de cada experimento debe tener una suma igual a 0
entonces solo r-1 errores de cada experimento son independientes.
Entonces, se asocian las SS y sus grados de libertad:
SS = SSu + SSA + SSE
or = 1 +(o - 1) + o(r - 1)
Los errores o desvos son variables aleatorias normalmente distribuidas, entonces se cumple que si
las suma de cuadrados se dividen por sus grados de libertad se obtienen variables con
distribuciones chi cuadrado y representan variancias de los datos.
1 a
SS
A
= cuadrado medio de A = MSA
) 1 ( r a
SS
E
= cuadrado medio de los errores = MSE
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 17 de 50
Si las 2 variables chi cuadrado se relacionan entre s se obtiene una variable F de Fisher con a-1
grados de libertad en el numerador y a(r-1) grados de libertad en el denominador.
MSE
MSA
F
0
La variable F de Fisher expresa relacin de varianzas.
Para probar la hiptesis nula H0 planteada con el modelo estadstico de la variable de respuesta, se
compara la variable F
0
estimada con los datos obtenidos de la simulacin respecto a la variable F de
tabla o F crtica, a fin de determinar si las medias corresponden a la misma muestra o los efectos del
factor son nulos.
Si F
0
es mayor que el quantil F
D;a-1;a(r-1)
de tabla, por lo tanto:
x SS
A
es considerada significativamente mayor que SS
E
.
x Se rechaza la H0, con lo cual las medias de las muestras son distintas o los efectos del factor
no son nulos o la variacin del error es menos significativa que la variacin por el factor.
x Se rechaza H0 y entonces el factor es significativo para la variable de respuesta. Los cambios
de nivel provocan cambios estadsticamente significativos en la respuesta.
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 18 de 50
Intervalos de Confianza
Los valores estimados de los parmetros del modelo estadstico de la variable de respuesta y
ij
son
variables aleatorias porque estn basados sobre una muestra de datos. Si se tomaran de otra
muestra los valores seran distintos. Por esa razn se estima el intervalo de confianza, que es un
indicador del grado de variabilidad.
Para calcular la variancia de los parmetros del modelo estadstico de la variable de respuesta, se
tiene la siguiente tabla:
Parmetro Estimacin Variancia
P
.. y ar / S
2
e
= MSE/ar
D
i .. y y
. i
ar / ) 1 a ( S
2
e
= MSE (a-1)/(ar)
P+D
i
. i
y
r / S
2
e
= MSE/r
grados de libertad para los errores = a (r-1) = N-1
Grados de libertad totales = N = ar
Tabla 1
Los intervalos de confianza (IC) se calculan en general como:
N
S
t y IC
N
2
1 ); 2 / 1 (
r
D
Luego de estimar el promedio y la variancia de cada trmino, se pueden estimar los dos valores
extremos del intervalo de confianza (IC) con el valor de t de Student con un nivel de confianza de (1-
D/2) y con (N -1) grados de libertad
En el caso de los efectos los IC pueden calcularse usando valores t de Student con a (r-1) grados de
libertad. Los IC de los efectos permiten detectar si hay efectos no significativos, si incluyen entre sus
extremos el valor cero. Significa que hay probabilidad de que el efecto del factor sea nulo.
El estimador de la media para un tratamiento (un factor en un determinado nivel) es:
i i
y D P
Estos estimadores se usan para comparar cualquier subconjunto de efectos.
Ejemplo de Aplicacin del Factorial Simple
En el problema integrador se desea observar el impacto que el tiempo de servicio de la mquina 1
tendr en el tiempo total de procesamiento del producto.
Para ello se propone estudiar:
x Factor A: tiempo de proceso de la mquina 1 (minutos).
x Niveles para el factor A: (20 minutos, 25 minutos, 30 minutos).
x Repeticiones: 5.
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 19 de 50
Analizando las salidas se obtienen los siguientes valores:
Nivel Repeticin Suma de
cada fila
Promedio
de cada fila 1 2 3 4 5
20 minutos 204 190 200 215 199 1008 201,6
25 minutos 233 229 243 215 256 1176 235,2
30 minutos 271 263 269 280 250 1333 266,6
Media
general 234,47
Estimacin de la Media
Segn la frmula: p =
1
N
_ _ y
]
u
=1
]=1
= y
..
y
..
=
(204+190+250)
15
= 2S4,47 (minutos)
Estimacin de los Efectos
Para obtener de los efectos para cada nivel del factor:
D
= y
i.
- p
o
1
= y
1.
- y
..
= 2u1,6 - 2S4,47 = -S2,87 (minutos)
o
2
= y
2.
- y
..
= 2SS,2 - 2S4,47 = u,7S (minutos)
o
3
= y
3.
- y
..
= 266,6 - 2S4,47 = S2,1S (minutos)
Se comprueba la Hiptesis:
La suma de todos los efectos del factor es 0. (_ D
u
=1
= u).
D
u
=1
= -S2,87 + u,7S +S2,1S = u
La interpretacin de los efectos es:
x Un tiempo de mquina de 20 minutos disminuye en 32,87 minutos el procesamiento.
x Un tiempo de mquina de 25 minutos aumenta en 0,73 minutos el procesamiento.
x Un tiempo de mquina de 30 minutos aumenta en 32,13 minutos el procesamiento
Estimacin del Error
Para estimar el error experimental cada elemento se calcula:
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 20 de 50
c
]
= y
]
- p - D
La matriz de los errores figura a continuacin:
Nivel Repeticin
1 2 3 4 5
1 2,400 -11,600 -1,600 13,400 -2,600
2 -2,200 -6,200 7,800 -20,200 20,800
3 4,400 -3,600 2,400 13,400 -16,600
La suma de los cuadrados de los errores (SSE) es:
SSE = c
]
2
u
=1
]=1
= (2,4)
2
+ (-11,6)
2
+ + (-16,6)
2
= 1767,2
Asignacin de la Variacin
Para calcular la asignacin de la variacin se calculan los SS:
SSY = (2u4)
2
+(19u)
2
+ +(2Su)
2
= 8S69SS,uu
SS0 = ai
2
= S S (2S4,47)
2
= 824619,27
SSA = i D
I
2
a
I=1
= S |(-S2,87)
2
+(u,7S)
2
+(S2,1S)
2
] = 1uS66,SS
SST = (y
Ij
-y
..
)
2
= SSY -SS0
a
I=1
r
j=1
= 8S69SS,uu -824642,71 = 12SSS,7S
La asignacin por el factor es: SSA/SST x 100 = 10566,53/12333,73 x 100 = 85,67 %
La asignacin por el error es: SSE/SST x 100 = 1767,2/12333,73 x 100 = 14,33 %
Anlisis de Varianza
Origen de las
variaciones
Suma de
cuadrados
Grados de
Libertad
Promedio de
los cuadrados F0 Probabilidad
Valor crtico
para F
Entre grupos
(factor A) 10566,53 2 5283,267 35,876 8,65E-06 3,885
Dentro de los
grupos (error) 1767,2 12 147,267
Total 12333,73 14
Se comprueba que F
0
> F
D;a-1;a(r-1)
de tabla (35,876 > 3,885), por lo tanto se rechaza la H0:
x el factor tiempo de mquina 1 afecta a la variable de respuesta tiempo de procesamiento
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 21 de 50
x los efectos del factor no son despreciables
x la variabilidad de las salidas de simulacin se debe principalmente a los efectos de los
niveles del factor.
Intervalos de confianza (IC)
Segn la tabla para estimar los IC de la media, la varianza se estima como ar / S
2
e
= MSE/ar y para los
efectos, la varianza es ar / ) 1 a ( S
2
e
= MSE (a-1)/(ar)
De la tabla del ANOVA, MSE = 147,267
Varianza = 147,267/(5x3) =9,82
T de Student para D = 0,05 y (15-1) grados de libertad, T
(1-D/2); N-1
= T
(0,975;14)
= 2,145
El intervalo de confianza para la media es
N
S
t y IC
N
2
1 ) ; 2 / 1 (
r
D
= 234,47 2,145 x 3,13 =234,47 6,72
227,75 d P d 241,19
Para los efectos:
Varianza = 147,267 x (5-1)/(5x3) = 39,27
ar
a S
t IC
N
) 1 (
2
1 ); 2 / 1 (
r
D
D
IC para el efecto D
1
: - 32,87 2,145x 6,26 = -32,87 13,44
-46,31 d D
1
d -19,43
IC para el efecto D
2
: 0,73 2,145x 6,26 = 0,73 13,44
-12,71d D
2
d 14,17
IC para el efecto D
3
: 32,13 2,145x 6,26 = 32,13 13,44
18,69d D
3
d 45,57
Se aprecia que el IC del nivel 2 incluye el cero, por lo que el efecto no es significativo, es decir, hay
probabilidad que sea cero.
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 22 de 50
Conclusiones
De lo visto anteriormente podemos concluir:
x El diseo unifactorial investiga la influencia de un slo factor en la respuesta.
x Se requieren varios niveles para el factor y varias repeticiones para cada corrida con el valor
del nivel dado.
x Se puede analizar el efecto del factor mediante: la asignacin de la variacin, el anlisis de
variancia (ANOVA) y los intervalos de confianza.
x En el caso de la asignacin de la variacin se comparan las variaciones debidas al factor y
debidas al error respecto a la variacin total.
x En el caso del ANOVA, se debe calcular el estadstico F
0
y compararlo con el valor F de tabla.
Da una interpretacin estadstica que es ms contundente que el anlisis de la variacin.
x Los intervalos de confianza permiten determinar la significacin de los factores observando si
el IC incluye o no al valor cero.
x Si se obtiene certeza que el factor influye significativamente en la respuesta se tiene
confianza en proseguir con otros estudios para tomar decisiones (optimizacin).
30 minutos 25 minutos 20 minutos
280
260
240
220
200
D
a
t
o
s
Grfica de caja de 20 minutos. 25 minutos. 30 minutos
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 23 de 50
Diseo factorial completo para dos factores
Se aplica cuando se quiere estudiar el impacto de dos factores (A y B) y sus interacciones (AB) en la
respuesta. Los factores tienen que ser categricos.
El factor A tiene a niveles (a 2) y el factor B tiene b niveles (b 2).
Modelo estadstico de la variable de respuesta
El modelo con repeticiones se expresa como:
y
]k
= p + D
+ [
]
+ y
]
+ c
]k
Donde:
y
]k
= respuesta con el factor A con nivel i, el factor B con nivel j en la repeticin k del experimento.
p = valor promedio general.
D
u
=1
= u).
La suma de todos los efectos del factor B es 0. (_ [
]
b
]=1
= u).
La suma de los efectos de la interaccin A con B en los niveles de B es 0. (_ y
]
b
]=1
= u).
La suma de los efectos de la interaccin A con B en los niveles de A es 0. (_ y
]
u
=1
= u).
La suma de los errores es 0. (_ c
]k
k=1
= u vi, ]).
Los errores son independientes y uniformemente distribuidos (IID)
Los errores tienen una distribucin normal.
Modelo estadstico sin repeticiones
El modelo estadstico de la respuesta sin repeticiones es:
y
]
= p + D
+ [
]
+ c
]
Cualquier observacin y
]
puede expresarse como un promedio general p, con la contribucin del
efecto del factor A, D
+ [
]
+ y
]
Clculo del promedio de la fila i (se suman los valores promedio de las celdas y se divide por el
nmero de columnas)
1
b
y
i].
b
]=1
= y
i..
= p + D
+
1
b
[
]
b
]=1
+
1
b
y
]
b
]=1
Por hiptesis:
La suma de todos los efectos del factor B es 0. (_ [
]
b
]=1
= u).
La suma de los efectos de la interaccin A con B en los niveles de b es 0. (_ y
]
b
]=1
= u).
Entonces se estima el efecto de A como:
D
= y
i..
- p
Clculo del promedio de la columna j (se suman los valores promedio de las celdas y se divide por el
nmero de filas):
1
o
y
i].
u
=1
= y
.].
= p +
1
o
D
u
=1
+ [
]
+
1
o
y
]
u
=1
Pero por hiptesis:
La suma de todos los efectos del factor A es 0. (_ D
u
=1
= u).
La suma de los efectos de la interaccin B con A en los niveles de a es 0. (_ y
]
u
=1
= u).
Entonces se estima el efecto de B como:
[
]
= y
.].
- p
A partir de estas ecuaciones se obtienen los estimadores:
p = y
.
D
= y
i..
- p = y
i..
- y
.
[
]
= y
.].
- p = y
.].
- y
.
Reemplazando en la ecuacin del promedio por celda los trminos calculados se obtiene el efecto
de la interaccin de los factores A y B:
y
i].
= p + D
+ [
]
+ y
]
y
i].
= y
.
+ y
i..
- y
.
+ y
.].
- y
.
+ y
]
SIMULACIN
Ingeniera Sistemas de Informacin Unidad 7
Pgina 25 de 50
y
]
= y
i].
+ y
.
- y
i..
- y
.].
En la siguiente tabla se generalizan los clculos
Niveles de B
1 2 . J . b y
|..
y
t..
N
i
v
e
l
e
s
d
e
A
1
y
111
y
11k
y
121
y
12k
...
y
1]1
...
y
1]k
...
y
1b1
...
y
1bk
y
1..
y
1..
2
y
211
...
y
21k
y
221
...
y
22k
...
y
2]1
...
y
2]k
...
y
2b1
...
y
2bk
y
2..
y
2..
... ... ... ... ... ... ... ... ...
I
y
11
...
y
2k
y
21
...
y
2k
...
y
]1
...
y
]k
...
y
b1
...
y
bk
y
..
y
i..
... ... ... ... ... ... ... ...
a
y
u11
...
y
u2k
y
u21
...
y
u2k
...
y
u]1
...
y
u]k
...
y
ub1
...
y
ubk
y
u..
y
u..
y
.j.
y
.1.
y
.2.
... y
.].
... y
.b.
y
...
y
..
y
.1.
y
.2.
... y
.].
... y
.b.
y
...
Donde
x Suma de las filas: y
..
= _ _ y
]k ] k
x Promedio del factor A: y
i..
=
y
i..
ib
,
x Suma de las columnas: y
.j.
= _ _ y
]k k
x Promedio del factor B: y
.].
=
y
.j.
ia
,
x Suma Total: y
...
= _ _ _ y
]k k ] i
x Promedio total:y
...
=
y
...
iab
,
Estimacin de los Errores
El error para el diseo factorial completo se calcula como:
c
]k
= y
i]k
- y
i].
A cada observacin se le resta el promedio de las celdas correspondientes y
i].
.