Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Analisis de Varianza Civilt PDF
Analisis de Varianza Civilt PDF
Los experimentos son parte natural en el proceso de la toma de decisiones en ingeniería y las
ciencias. Supóngase, por ejemplo, que un ingeniero civil investiga los efectos de diferentes
métodos de curado sobre la resistencia a la compresión media del concreto. El experimento
consistiría en formar varios ejemplos de prueba de concreto utilizando cada uno de los métodos de
curado propuestos para después probar la resistencia a la compresión de cada ejemplar de
prueba. Los datos de este experimento podrían usarse a fin de determinar qué método de curado
deberá usarse para conseguir la resistencia a la compresión media máxima.
Si sólo hay dos métodos de curado que sean de interés, este experimento podría diseñarse y
analizarse aplicando los métodos para hipótesis estadísticas con dos muestras. Es decir, el
experimentador tiene un solo factor de interés (el método de curado) y sólo hay dos niveles del
factor.
Las técnicas de diseño experimental basadas en la estadística son particularmente útiles en el
campo de la ingeniería para mejorar el desempeño de un proceso de manufactura. Tiene también
diversas aplicaciones en el desarrollo de nuevos procesos. La mayoría de los procesos pueden
describirse en términos de varias variables controlables, como la temperatura, la presión y la
rapidez de alimentación. Mediante el uso de experimentos diseñados, los ingenieros pueden
determinar el subconjunto de las variables del proceso que ejerce mayor influencia sobre el
desempeño del proceso . Los resultados de un experimento como éste pueden llevar a 1) El
mejoramiento del rendimiento del proceso, 2) La reducción de la variabilidad del proceso y a una
concordancia más próxima con los requerimientos nominales o proyectados.3) La reducción del
tiempo de diseño y desarrollo. 4) La reducción en el costo de operación.
ANALISIS DE VARIANZA
El análisis de varianza se sigue para facilitar una prueba de hipótesis, mediante la cual la variación
total presente en un conjunto de datos se particiona en varias componentes, algunas se atribuyen
a variables explicativas o factores y otra al azar (error inmerso en el modelo) de modo que en el
análisis es posible averiguar la magnitud de las contribuciones de cada una de las fuentes a la
variación total.
El análisis de varianza tiene su aplicación más amplia en análisis de los datos obtenidos a
partir de experimentos.
El análisis de varianza se utiliza en dos fines:
Estimar y probar la hipótesis acerca de las varianzas de las poblaciones.
Estimar y probar la hipótesis acerca de las medias de las poblaciones.
Este diseño debe limitarse su uso a casos en los cuales se dispone de unidades
experimentales homogéneas. Si no pueden obtenerse tales unidades, debe utilizarse algún
bloqueo para incrementar la eficiencia del diseño.
MODELO.
Suponga que se tiene K niveles de un solo factor que se desean comparar.
La respuesta observada a partir de cada uno de los K niveles o tratamientos es una
variable aleatoria. Los datos aparecen en la tabla. Yij representa la i_ésima
observación tomada bajo el tratamiento “j”.
TRATAMIENTOS
1 2 . . . K
y11 y12 . . . y1k
y21 y22 . . . y2k
. . .
OBSERVACIONES
. . .
. . .
yn1 yn2 . . . ynk
Medias
̅ .1 ̅ .2 . . . ̅ .k
VARIANZAS 2 2 2
S .1 S .2 . . . S .k
̅ . j = T. j / n j media del j-ésimo TT0 .
El modelo a efectos fijos implica que se está interesado solo en “k” poblaciones representados
por los datos de la muestra. Cualquier inferencia que pueda hacerse se aplica solo a estas
poblaciones.
a) Los k conjuntos de datos observados constituyen “k” muestras aleatorias independientes de las
poblaciones respectivas.
b) Cada una de las poblaciones de las cuales proviene las muestras está distribuida
2
normalmente con media j y varianza j .
2 2 2
c) Las k poblaciones tienen la misma varianza : 1 = 2 = . . . = k
2
d). Los Ɛi j DNI (0, ).
HIPOTESIS.
Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a cero, de
modo que alternativamente la hipótesis puede enunciarse como:
H0 :µj = 0; J=1, 2, . . . k
H1 : no todas las µj =0
Se elige el nivel de significación α :
2 2 ... 2
Si H0 es verdadero y si σ 1 = σ 2 = =σ k y las poblaciones tienen una distribución normal; la
situación se observa como fig. 1
2 2 ... 2
σ 1=σ 2= =σ k
Si H0 es falso pueda serlo debido a que una de las medias de las poblaciones difiere del resto que
son iguales entre si, o bien puede ocurrir que todas las medias poblacionales sean diferentes. Es
decir al menos una de las j para cualquier valor de j=1,…,k ; sea diferente del resto
4. CALCULOS.
1
j 0
(y y 2
SCT = ij y ) 2
= ij
j 1 i 1 j 1 N
Pero
k nj
SCT = ( y
j 1 1
ij y j y j y ) 2
k nj k nj
SCT= ( y
j 1 1
ij y j ) 2
+ ( y
j 1 1
j y ) 2
SCE SCTR
(Suma de cuadrados dentro) (Suma de cuadrados entre)
(Suma de cuadrados del Error) (Suma de cuadrados de tratamientos)
k nj nj
(T j ) 2
( yij y j ) 2
k k
SCE =
j 1 1
= y j 1
2
ij
j 1 nj
= E yy
k nj
(T j ) 2 T2
( y
k
y )
2
SCTR = j = TYY
j 1 1 j 1 nj N
k (T j ) 2 T2 k (T j ) 2
SCTR = j 1 nj
N
=
j 1 nj
M YY
T2 k nj
Donde: M YY =
N
SCE = SCT – SCTR = y 2
ij - MYY - TYY
y j 1
6. DECISION.
La decisión de realizar o no H0 se toma definiendo la región crítica (RC)
f(F)
RAH0 RRH0
F
F , k-1, N-k
Ejemplo 1: Un ingeniero desea mejorar la resistencia a la compresión del concreto. Sospecha que
la resistencia es una función de la concentración de un aditivo. Decide investigar con distintas
concentraciones: 5, 10, 15, 20 y 25 %. Han de tomarse cinco observaciones para cada
concentración de aditivo, empleando una planta piloto. Las 25 observaciones necesarias se
realizan en forma aleatoria, y los datos obtenidos se muestran en la tabla.
2
Tabla 1.1: Resistencia a la compresión del concreto (PSI = lib/pulg )
TRATAMIENTOS
Concentración del aditivo TOTAL
5% 10% 15% 20% 25%
7 12 14 19 7
7 17 18 25 10
15 12 18 22 11
11 18 19 19 15
9 18 19 23 11
TOTALES(Ti) 49 77 88 108 54 376
Numero de observaciones 5 5 5 5 5 25
Medias(ŷi) 9.8 15.4 17.6 21.6 10.8 15.04
SOLUCION EJEMPLO 1
2. Suposiciones:
Se tiene 5 muestras independientes
Cada provisión N(μj , σ j).
2
ΣΣ Ƭj = 0 y Ɛij
2
DNI(O, σ )
6. Regla de decisión:
Si Fc > Fα,(k - 1),(n - k) H0 se rechaza a un nivel de α
Si Fc ≤ Fα,(k - 1),(n - k) H0 no se rechaza.
7. Cálculos: se realizan los cálculos para obtener las estimaciones en la tabla ANOVA; es decir:
El ANOVA resultante se muestra en la siguiente tabla:
En
Comparisons
indicar los
En Option : indicar el Nivel
métodos de
de Confianza
comparación
múltiples de
Tukey y Fisher
RESULTADOS CONCLUSIONES
COMPARACIONES MULTIPLES
GRAFICA DE INTERVALOS DE
CONFIANZA DE LA RESISTENCIA Y
CONCENTRACIÓN GRAFICA DE PUNTOS DE LOS RESIDUOS
Interval Plot of Resistencia vs Concentración
95% CI for the Mean
25
20
Resistencia
15
10
5
5.00% 10.00% 15.00% 20.00% 25.00%
Concentración
The pooled standard deviation was used to calculate the intervals.
Boxplot of Resistencia
25
4
20
3
Resistencia
15
10
5
5.00% 10.00% 15.00% 20.00% 25.00%
Concentración
SOLUCION EJEMPLO 2
Yij = u + j + ei j ; i = 1, 2, ... , n
Donde :
: Es una constante e indica el efecto medio verdadero; parámetro común a todos TT 0S.
ei j : incluye los efectos de todos los otros factores extraños. Es un término de error ,
considerado como variable aleatoria
Si las medias de las poblaciones son iguales, cada efecto del tratamiento es igual a
cero, de modo que alternativamente la hipótesis puede enunciarse como:
H0 : j = 0; j=1, 2, . . . k
H1 : j 0
Indicar la variable
respuesta que es la
Resistencia a la
tensión y el Factor o
variable respuesta
es el “% de
Algodón”.
En
Comparisons
indicar los
métodos de
En Option: indicar el Nivel
comparación
de Confianza
múltiples de
Tukey y Fisher
RESULTADOS CONCLUSIONES
COMPARACIONES MULTIPLES
Hubiera sido preciso realizar un Análisis exploratorio de Datos que nos permitiera como
actividad principal revisarlos para saber como es su comportamiento y así poder asignarle un
modelo adecuado.
20
Resistencia Tensión
15
10
2) Este método requiere que la atención del analista se centre en los residuales o
lo que queda después de haber aplicado algún tipo de análisis.
(El tipo de sustancia química NO influye de manera altamente significativa en la resistencia del
material)
(Al menos un tipo de sustancia química influye de manera altamente significativa en la resistencia
del material)
RESULTADOS
I) Como p value para el Tipo de Sustancia
Química = 0.000< 0.01, Se Rechaza H0 y
Se concluye que al menos un Tipo de
sustancia química influye de manera
altamente significativa en la resistencia
del material.
El nombre de cuadrado Latino se debe a R.A. Fisher [The Arrangement of Field Experiments, J.
Ministry Agric., 33: 503-513 (1926)]. Las primeras Aplicaciones fueron en el campo agronómico,
especialmente en los casos de suelos con tendencias en fertilidad en dos direcciones.
Cada observación del experimento es expresado como una relación lineal de los efectos
involucrados (tratamiento, fila y columna), así:
Ejemplo 4
Para estudiar el efecto del Tipo de iluminación (A=natural, B=muy fuerte, C=escasa) en la
velocidad de lectura, se realiza un experimento que consiste en contar el número de palabras
leídas en un minuto en distintos tipos de papel (b=blanco, c=en color, s=satinado) y diferente
tipografía (g=letra grande, p=letra pequeña, n=normal). Los resultados obtenidos son los de la tabla
adjunta. Analizar con α= 0.05, estos datos y estudiar la posible influencia de los factores
iluminación, tipos de papel y diferente tipografía en la variable Velocidad de Lectura.
Tipo de Papel
Letra
Satinado Blanco Color
Grande 258 A 230 C 240 B
Normal 235 B 270 A 240 C
Pequeña 220 C 225 B 260 A
SOLUCIÓN Ejemplo 4
Las hipótesis a probar son:
C 1 2 230
B 1 3 240
B 2 1 235
A 2 2 270
C 2 3 240
C 3 1 220
B 3 2 225
A 3 3 260
3 4
RESULTADOS
I) Como p value para el Efecto del Tipo de Iluminación = 0.004 < 0.05, II) Como p value para Tamaño de Letra=0.031 < 0.05, Se Rechaza H0 y Se
Se Rechaza H0 y Se concluye que al menos un Tipo de Iluminación concluye que al menos un Tipo de Letra influye de manera significativa en
influye de manera significativa en la Velocidad de lectura. la Velocidad de lectura.
III) Como p value para Tipos de Papel = 0.066 > 0.05, se Acepta H0 y Se concluye que el tipo de Papel NO influye de manera significativa en la
Velocidad de lectura.
Modelo estadístico.
Cada observación del experimento es expresado como una relación lineal de los efectos
involucrados (tratamiento, fila y columna), así:
Ejemplo 5
Se compara el rendimiento de cinco procesos de fabricación (A, B, C, D,E) en cinco
condiciones experimentales (α,β,ϒ,δ,ξ), cinco métodos distintos y en cinco días diferentes,
sobre la Resistencia de un material. El Diseño y los resultados se indican en el cuadro
adjunto.
Día
Método
1 2 3 4 5
1 Aα 24 Bϒ 20 Cξ 19 Dβ 24 Eδ 24
2 Bβ 17 Cδ 24 Dα 30 Eϒ 27 Aξ 36
3 Cϒ 18 Dξ 38 Eβ 26 Aδ 27 Bα 21
4 Dδ 26 Eα 31 Aϒ 26 Bξ 23 Cβ 22
5 Eξ 22 Aβ 30 Bδ 20 Cα 29 Dϒ 31
SOLUCIÓN Ejemplo 5
Las hipótesis a probar son:
(Al menos uno de los Días influye de manera significativa en la Resistencia del Material)
RESULTADOS
I) Como p value para procesos de fabricación =0.003 < 0.05, Se Rechaza H0, Se concluye que Al menos un proceso
de fabricación influye de manera significativa en la Resistencia del Material
II) Como p value para Métodos =0.178 > 0.05, Se Acepta H0, Se concluye que El Método NO influye de manera
significativa en la Resistencia del Material
III) Como p value para Días =0.033 < 0.05, Se Rechaza H0, Se concluye que Al menos uno de los Días influye de
manera significativa en la Resistencia del Material
IV) Como p value para Condiciones Experimentales =0.208> 0.05, Se Acepta H0, Se concluye que Las
Condiciones Experimentales NO influyen de manera significativa en la Resistencia del Material.
Ejercicio 1
Un experimentador estudia los efectos que contiene cinco formulaciones diferentes de carga propulsora utilizada en
los sistemas de expulsión de la tripulación de un avión basado en la rapidez de combustión. Cada formulación se
hace un lote de materia prima que solo alcanza para probar cinco formulaciones. Además, las formulaciones son
preparadas por varios operadores, y puede haber diferencias sustanciales en las habilidades y experiencia de los
operadores. También se considera que los montajes de prueba pueden ser importantes, ya que hay cinco montajes
de prueba diferentes. Una vez que se ha corrido el experimento se recolectaron los datos que a continuación se
muestran. Realice el análisis de varianza que verifique si existe una diferencia en la media de la rapidez de
combustión, generada por las diferentes formulaciones de carga propulsora, tomando en cuenta un nivel de
significancia de α= 0.05
Lotes de Operadores
Materia Prima 1 2 3 4 5
1 Aα 23 Bϒ 20 Cξ 18 Dβ 23 Eδ 23
2 Bβ 16 Cδ 23 Dα 29 Eϒ 26 Aξ 35
3 Cϒ 17 Dξ 37 Eβ 25 Aδ 26 Bα 20
4 Dδ 25 Eα 30 Aϒ 25 Bξ 22 Cβ 21
5 Eξ 21 Aβ 29 Bδ 19 Cα 28 Dϒ 30
Ejercicio 2
Un ingeniero desarrolla un experimento para comparar cinco procedimientos de fabricación de ladrillo de concreto, en
el cual usa material de cinco mezclas preparadas cada una de ellas en cada uno de cinco días consecutivos y
preparados en cinco máquinas diferentes. (Tomado de WALPOLE R.E, MYERS R.H, MYERS S.L: “ Probabilidad y
Estadística para Ingenieros. Ed . Prentice Hall”)
Dias
Mezclas
1 2 3 4 5
1 Aα 1 Bϒ 0 Cξ 4 Dβ 0 Eδ 1
2 Bβ 3 Cδ 4 Dα 1 Eϒ 5 Aξ 3
3 Cϒ 2 Dξ 5 Eβ 0 Aδ 0 Bα -1
4 Dδ -1 Eα 2 Aϒ 1 Bξ 1 Cβ 4
5 Eξ 0 Aβ 1 Bδ -3 Cα -3 Dϒ 1