Documentos de Académico
Documentos de Profesional
Documentos de Cultura
ESTADÍSTICA APLICADA A LA
INVESTIGACIÓN
ANIVAL TORRE
SEMESTRE ACADÉMICO
2021B
Clase 5
ANÁLISIS DE VARIANZA
Introducción
6
Definiciones Básicas
Nivel Del Factor: es cada una de las categorías, valores o formas específicas del factor.
Factor Cualitativo: sus niveles se clasifican por atributos cualitativos.
Factor Cuantitativo: sus niveles son cantidad numérica en una escala.
Factores Observacionales: El investigador registra los datos pero no interfiere en el proceso
que observa.
Factores Experimentales: El investigador intenta controlar completamente la situación
experimental.
7
Experimento Unifactorial: es aquel en el se estudia un solo factor.
Experimento Multifactorial: es aquel en el que se estudia simultáneamente
más de un factor.
8
Error Experimental: Describe la variación entre las unidades experimentales tratadas de
forma idéntica e independiente. Orígenes del error experimental:
•Variación natural entre unidades experimentales
•Variabilidad en la medición de la respuesta
•Imposibilidad de reproducir idénticas condiciones del tratamiento de una unidad a otra
•Interacción de tratamientos con unidad experimental
•Cualquier factor externo
9
Elementos Del Diseño De Experimentos
El diseño de experimentos se refiere a la estructura del experimento
considerando:
1. El conjunto de tratamientos incluidos en el estudio.
2. El conjunto de unidades experimentales utilizadas en el estudio.
3. Las reglas y procedimientos por los cuales los tratamientos son asignados
a las unidades experimentales (o viceversa).
4. Las medidas o evaluaciones que se hacen a las unidades experimentales
luego de aplicar los tratamientos.
10
Principios Básicos Del Diseño De Experimentos
11
Principios Básicos Del Diseño De Experimentos
12
Análisis de Asociación
Análisis de Regresión vs. Análisis de Varianza
13
Relaciones entre Análisis de Regresión y
Análisis de la Variancia
14
Los Tipos de Modelos.
15
ESTADÍSTICA
PARAMÉTRICA
Estadístico de prueba
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
• Si el valor p-valor (sig.) ≤ α , rechace la hipótesis nula de medias iguales y concluya que al
menos una de las medias poblacionales es diferente de las otras.
• Si el valor p-valor(sig.) > α, no rechace la hipótesis nula de medias iguales.
Ejemplo:
Un estudio compara los efectos de la vacuna X en cuatro muestras (niñ os,
adolescentes, adultos y ancianos) durante un mes. Presentamos las ventas
unitarias de 5 tiendas que utilizaron las 4 promociones en meses distintos:
Niños Adolescentes Adultos ancianos
78 94 73 79
87 91 78 83
81 87 69 78
¿Las promociones producen diferentes efectos sobre las ventas?
89 90 83 69
85 88 76 81
ANOVA
Suma de Media Factor
Resultado cuadrados df cuadrática F Sig. Bayesa
Entre grupos 612,150 3 204,050 9,694 0,001 51,532
H 0 : 1 2 3 4 0
H 1 : Al menos dos de los tratamientos
tienen efectos s
. . . ... . ... . .
. . . ... . ... . .
i Yi1 Yi2 ... YiJ ... Yib Ti.
. . . ... . ... . . Y i.
. . . ... . ... . .
. . . ... . ... . .
K ... ...
Yk1 Yk2 YkJ Ykb TK.
Y k.
Total T.1 T.2 ... T.j ... T.b T..
Media ... ...
Y .1 Y .2 Y .j Y .b Y ..
06/08/2023 DISEÑO DE EXPERIMENTOS 27
Tabla de Análisis de varianza para
dos criterios de clasificación
Fuente de Suma de Grados de Cuadrados F calculada
variación Cuadrados libertad Medios
Tratamientos SCTr t-1 CMTr = SCTr / t-1 CMTr / CME
Bloques SCB b -1 CMB = SCB / b-1 CMB / CME
29
Diseño De Bloques Completos Aleatorizados
30
Análisis De La Varianza: Clasificaciones según
dos Criterios
31
Diseños En Bloques Aleatorizados
32
Diseño En Bloques Completos
Aleatorizados
33
Ejemplo: Para el ensamble de un artículo se considera
comparar 4 máquinas diferentes. Como la operación de las
máquinas requiere cierta destreza se anticipa que habrá una
diferencia entre los operarios en cuanto a la velocidad con la
cual operen la maquinaria. Se decide que se requerirán 6
operarios diferentes en un experimento de bloques
aleatorizado para comparar las máquinas.
Entonces, el factor de interés es uno sólo, pero se crea
otro factor para controlar la variabilidad extraña y
excluirla así del error experimental.
Aleatorización: debemos asignar cada tratamiento,
M1, M2, M3, y M4 a cada bloque.
34
Operario 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6
22 75 76 84 5 16
45 31 25 51 79 44
27 70 98 10 36 29
2 86 85 78 95 14
M2 M3 M2 M4 M1 M2
M4 M1 M1 M2 M3 M4
M3 M2 M4 M1 M2 M3
M1 M4 M3 M3 M4 M1
35
Si las máquinas no difieren en cuanto a la velocidad de ensamblado de la pieza,
tendrían igual velocidad promedio y las curvas se superpondrían exactamente.
µ1 µ2 µ3 µ4
36
EL MODELO (DE EFECTOS FIJOS)
Yij = µ + αi + βj + eij
3
42
40
5
38 6
1 2 3 4
Tratamiento
38
Si aplicamos el Método de los Mínimos Cuadrados, para estimar los
parámetros
1 b t
ˆ .. y.. = y Donde b son los bloques y t los
bt i 1 j 1 ij
tratamientos
40
Tiempo en segundos para el
ensamble del producto
Operario
Máquina 1 2 3 4 5 6 Total Medias
1 42,5 39,3 39,6 39,9 42,9 43,6 247,8 41,3
2 39,8 40,1 40,5 42,3 42,5 43,1 248,3 41,4
3 40,2 40,5 41,3 43,4 44,9 45,1 255,4 42,6
4 42,3 43,2 44,5 45,2 46,9 43,3 265,4 44,2
Total 164,8 163,1 165,9 170,8 177,2 175,1 1016,9
Fc =
Medias 41,2 40,775 41,475 42,7 44,3 43,775 254,225 42,4
Yij 2
i j
Factor de Corrección = b.t
1 2
Suma de Cuadrados Tratamientos = Ti. Fc
1 b i
2
Suma de Cuadrados de Bloques = T. j Fc
t j
Yij2 Fc
Suma de Cuadrados Total = i j
H 0 : 1 2 3 4 0
H 1 : Al menos dos de los tratamientos
tienen efectos s
Total 67315 44
Bloque :
Tratamiento 1 2 ... j ... b Total Media
1 Y11 Y12 ... Y1J ... Y1b T1.
2 ... ...
Y 1.
Y11 Y12 Y1J Y1b T2.
. . . ... . ... . .
Y 2.
. . . ... . ... . .
. . . ... . ... . .
i Yi1 Yi2 ... YiJ ... Yib Ti.
. . . ... . ... . . Y i.
. . . ... . ... . .
. . . ... . ... . .
K ... ...
Yk1 Yk2 YkJ Ykb TK.
Y k.
Total T.1 T.2 ... T.j ... T.b T..
Media ... ...
Y .1 Y .2 Y .j Y .b Y ..
06/08/2023 DISEÑO DE EXPERIMENTOS 47
Tabla de Análisis de varianza para dos criterios
de clasificación
Fuente de Suma de Grados de Cuadrados F calculada
variación Cuadrados libertad Medios
Tratamientos SCTr t-1 CMTr = SCTr / t-1 CMTr / CME
Bloques SCB b -1 CMB = SCB / b-1 CMB / CME
06/08/2023 49
• Dicha situación requiere de un experimento con el
diseño aleatorio por bloques, pero para probar la
interacción se requieren al menos dos observaciones
para cada combinación de tratamientos (máquinas) y
bloques (grupos de personal). Un experimento
apropiado en el que se hacen precisamente dos
observaciones para cada una de estas combinaciones,
puede producir los resultados de la siguiente tabla:
06/08/2023 50
DISEÑO ALEATORIO POR BLOQUES: CON INTERACCION
Tratamiento j (tipo de máquina) Totales por Medias por
Bloque, i (grupo) 1 2 3 Bloque Bloque
06/08/2023 52
2. Probar esta segunda hipótesis ayuda al
gerente a decidir, sueldos promociones o
despidos, μA=μB=μC =μD
H0: El número promedio de unidades
producidas es el mismo con cada grupo
de personal.
H1: Al menos una de estas medias
poblacionales es diferente de las otras.
06/08/2023 53
3. Probar esta tercera hipótesis ayuda al
gerente a decidir, una asignación mejor
de grupos particulares a varias
máquinas.
H0: Máquinas y grupos de personal no
interactúan con respecto al número
promedio producido
H1: Hay interacción entre máquinas y
grupos de personal.
06/08/2023 54
Variación entre columnas: Explicada por Tratamientos
SST rb Y j Y.. 2(4) (49,5 44) 2 (41 44) 2 (41,5 44) 2 364
2
2(3) (45,67 44) 2 (43,67 44) 2 (43,33 44) 2 (43,33 44) 2 22,67
06/08/2023 55
Variación Explicada por Interacción
SSI r Yij Yi Y j Y..
2
2 (49 45.67 49.5 44) 2 (44 45,67 41 44) 2
(44 45,67 41,5 44) 2 (57 43,67 49,5 44) 2
(35 43,67 41 44) 2 (39 43,67 41,5 44) 2
(53 43,33 49,5 44) 2 (36 43,33 41 44) 2
(41 43,33 41,5 44) 2 (39 43,33 49,5 44) 2
(49 43,33 41 44) 2 (42 43,33 41,5 44) 2 629,33
06/08/2023 56
Variación debida al TOTAL
SST (50 44) 2 (48 44) 2 ... (39 44) 2 1106
06/08/2023 57
Tabla ANOVA Bidireccional con Interacción
Fente de Suma de Cuadrados Grados de Libertad Cuadrado Estadística de
variación (1) (2) Medio prueba
(3)=(1)/(2)
• F(2;12)0,01=6,83
• F(3;12)0,01=5,95
• F(6;12)0,01=4,82
• Pueden tomar la decisión FINAL
06/08/2023 58
• REPRESENTACIÓN SIMBÓLICA DE LOS DATOS
• En el supuesto que se tienen "a"
tratamientos y se han seleccionado “b”
bloques y llevado a cabo una réplica
completa del experimento en cada uno
de los bloques. La representación típica de
los datos para este tipo de Diseño es la
siguiente:
06/08/2023 59
06/08/2023 60
06/08/2023 61
06/08/2023 62
06/08/2023 63
• Por lo tanto:
• SST = SSTratamientos + SSBloques + SSE
• donde
• SST : Tiene N-1 grados de libertad, porque existen N observaciones en total
y un sólo
• parámetro a estimar que es µ .
• SSTratamientos : Tiene a-1 grados de libertad, porque existen “ a ” niveles
del factor y un solo parámetro a estimar que es ιi .
• SSBloques : Tiene b-1 grados de libertad, porque existen “ a ” bloques y
un sólo parámetro a estimar que es βj .
• SSE : Tiene (a-1)(b-1) grados de libertad, porque existen ab celdas que
proporcionan ab-1 grados de libertar y la suma de cuadrados del error no
es mas que la suma de cuadrados entre las celdas, menos la suma de
cuadrados de tratamiento y la suma de cuadrados de bloques; entonces los
grados de libertad del error serán: ab-1-(a-1)-(b-1) = (a-1)(b-1).
• Los grados de libertad de la suma total debe ser igual a la suma de
los grados de libertad de SSTratamientos , SSBloques y SSE; es decir, N-1
= (a -1)+( b-1)+( a-1)( b-1) = ab-1.
06/08/2023 64
• Matemáticamente estas sumas se obtienen de la siguiente manera:
06/08/2023 65
Las medias de cuadrados o cuadrados medios, que se
definen en función de las sumas de cuadrados y los grados
de libertad; es decir, cada suma de cuadrados dividida entre
sus grados de libertad es igual a una media de cuadrados.
06/08/2023 66
Matemáticamente se expresan de la manera siguiente:
06/08/2023 67
06/08/2023 68
• Ejemplo 2
• Se probaran 5 raciones respecto a sus diferencias
en el engorde de novillos. Se dispone de 20 novillos
para el experimento, que se distribuyen en 4
bloques (5 novillos por bloque) con base a sus
pesos, al iniciar la prueba de engorde. Los 5
tratamientos (raciones) se asignaron al azar dentro
de cada bloque. Los novillos más pesados se
agruparon en un bloque, en otro se agruparon
los 5 siguientes más pesados y así sucesivamente.
Se obtuvieron los siguientes datos:
06/08/2023 69
06/08/2023 70
• Datos
• Tratamientos: a = 5 , Bloques : b = 4
• Número total de observaciones: N = 5x4 = 20
• i = 1,2,3,4,5 , j = 1,2,3,4
• Para que los cálculos matemáticos resulten más fáciles, la
siguiente tabla muestra los datos de la tabla anterior codificados
(restándoles 1 y multiplicando el resultados por 10).
06/08/2023 71
06/08/2023 72
06/08/2023 73
06/08/2023 74
06/08/2023 75
06/08/2023 76
06/08/2023 77
• Conclusión
• Las cinco raciones no son igualmente efectivas en el engorde de
novillos o la cantidad de ración influye significativamente en el
engorde de los novillos.
06/08/2023 78
06/08/2023 79
06/08/2023 80
06/08/2023 81
06/08/2023 82
06/08/2023 83
• Se considera que la adición de Co puede incrementar la resistencia a
la tensión del acero y se experimenta con 4 niveles de Co, pero el tipo
de horno en que se hace la fundición se cree que produce
variabilidad, asi que se usa como bloque, se hacen dos medidas en
cada bloque con cada nivel de Co, la tabla muestra los resultados de
resistencia a la tensión en miles de PSI
06/08/2023 84
06/08/2023 85
• Ahora repita el análisis y en este caso no considere las repeticiones
para efectos de cálculo si no que calcule los promedios de ellos y
tomelos como lecturas únicas, compare los resultados.
06/08/2023 86
Problema 7
06/08/2023 87
𝐻 0: 𝜇 1 = 𝜇 2 = 𝜇 3 …
𝐻1: 𝜇1 ≠ 𝜇2 ≠ 𝜇 3 … Solución Problema 7
ANOVA
Suma de Media Factor
Resultado cuadrados df cuadrática F Sig. Bayesa
Entre grupos 1135,000 3 378,33329,790 0,000 34835,715
Dentro de grupos 203,200 16 12,700
06/08/2023 93
TIPO DE BLOQUES
ABONO
1 2 3 4 5 6 7
A 35.4 34 38 35.8 33.5 37.6 35.5
B 33 32 37 34.5 32.7 36 36
C 24 23.8 28 23.4 24 25 24
06/08/2023 94
DIRECTRICES O PROCEDIMIENTO PARA EL
DISEÑO EXPERIMENTAL.
06/08/2023 95
guía del procedimiento a seguir
• Primero: Reconocimiento y Planeamiento del problema.
• Es necesario desarrollar todas las ideas sobre los objetivos del
experimento. Una clara comprensión y planteamiento del
problema con frecuencia contribuye sustancialmente a un mayor
entendimiento del fenómeno y a la solución final del problema.
• Suele ser importante solicitar la opinión de todas las partes
implicadas; ya que normalmente saben mucho del problema.
06/08/2023 96
• Segundo: Elección de Factores y Niveles.
• Se deben seleccionar los factores que van a ser
investigados en el experimento, los intervalos de
variación y los niveles específicos a los cuales se
hará el experimento. Además debe considerarse
la forma en que se controlarán estos
factores para mantenerlos en los valores deseados y
como se les medirá.
06/08/2023 97
• Tercero: Selección de la Variable Respuesta.
• El experimentador debe seleccionar la variable
respuesta o variable dependiente de tal forma que
esté seguro que la respuesta, que se va a medir,
realmente proporcione información útil a cerca del
problema en estudio.
• Las respuestas en un problema pueden ser
múltiples. Por ejemplo, en el experimento de
eficacia de seis fertilizantes de nitrógeno para
cierta variedad de maíz (analizado anteriormente),
la variable respuesta es el rendimiento.
06/08/2023 98
• En general, un experimento de este tipo puede
tener simultáneamente otras variables respuestas;
como por ejemplo altura de plantas,
determinación del contenido de humedad de las
semillas, color de las semillas, etc. Pero en este
momento se habla solamente del rendimiento, el
cual se considera que es la variable de interés mas
importante para el investigador.
06/08/2023 99
• Cuarto: Elección del Diseño Experimental.
• Para definir o determinar el diseño experimental a utilizar se debe
considerar el tamaño muestral (número de repeticiones), seleccionar un
orden adecuado para los ensayos experimentales y determinar si hay
implicaciones de bloque u otras restricciones de aleatorización. Además tener
presente los objetivos experimentales.
• El investigador debe decidir qué constituye una unidad experimental, cuántas
réplicas de las unidades experimentales exige cada tratamiento y qué
tratamiento asignar a cada una de ellas. También, debe determinar si
agrupará por bloques las unidades experimentales en grupos
homogéneos para controlar el error experimental.
• Con base al Diseño Experimental debe proponerse un Modelo Matemático
adecuado.
06/08/2023 100
• Quinto: Ejecución del Experimento.
• En esta fase se lleva a cabo la recolección
de los datos. Se debe observar
cuidadosamente el proceso para asegurar que todo
se realice conforme lo planteado; ya que los errores
en el procedimiento suelen anular la validez del
experimento.
06/08/2023 101
• Sexto: Análisis de los Datos.
• Se deben utilizar métodos estadísticos para analizar
los datos, para que los resultados y conclusiones
sean objetivos más que apreciativos. Si todo se ha
realizado correctamente los métodos estadísticos que
se necesitan no son complicados.
06/08/2023 102
• Séptimo: Conclusiones y Recomendaciones.
• Consiste en la interpretación de las inferencias
estadísticas. Y para llevar a cabo la presentación
de los resultados son muy útiles los métodos
gráficos, en especial cuando se presentan a otros
personas. Es bien importante también realizar
corridas de seguimiento y pruebas de
confirmación para llevar a cabo la validación
de las conclusiones del experimento.
06/08/2023 103
GRACIAS