Está en la página 1de 104

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE CIENCIAS DE LA SALUD


UNIDAD DE POSGRADO

MAESTRÍA EN SALUD OCUPACIONAL Y


AMBIENTAL
(Resolución N° 442-2019-CU de fecha 11 de noviembre de 2019)

ESTADÍSTICA APLICADA A LA
INVESTIGACIÓN

ANIVAL TORRE
SEMESTRE ACADÉMICO
2021B
Clase 5

ANÁLISIS DE VARIANZA
Introducción

Uso del software SPSS

Modelo de efecto de bloques


Objetivos:

Al finalizar esta unidad el estudiante será capaz de:


1 Describir los elementos estadísticos de un diseño experimental.
2 Definir el objetivo de un análisis de varianza.
3 Formular hipótesis adecuadas para las diferentes situaciones.
4 Describir la distribución de F.
5 Construir la tabla de análisis de varianza.
6 Calcular F e interpretar los resultados de la prueba de hipótesis.
Principios del diseño
Experimental
EL Diseño de Experimentos
• Está relacionado básicamente con el planeamiento de la recolección
de los datos.
Un Experimento
• Es la Muestra en base a la cual se estimarán los parámetros
Poblacionales, y se tomarán decisiones con respecto a la comparación
de las poblaciones en estudio.
• Cada experimento es una pregunta que se hace a la naturaleza, por lo
tanto, para que las respuestas no sean confusas o contradictorias, es
necesario que el mismo sea:
1) Técnicamente planeado
2) Cuidadadosamente conducido
3) Adecuadamente analizado
4) Cautelosamente interpretado
5
Razones

• Por lo general, un experimento es realizado por una o


varias de las razones siguientes:
1.Identificar las principales causas de variación en la
respuesta .
2.Encontrar las condiciones que permitan alcanzar un
valor ideal en la respuesta.
3.Comparar las respuestas a diferentes niveles de factores
controlados por el investigador
4.Construir modelos que permitan obtener predicciones
de la respuesta.

6
Definiciones Básicas

Variable Respuesta: es la variable en estudio, aquella cuyos cambios se desean estudiar. Es la


variable dependiente.

Factor: es la variable independiente. Es la variable que manipula el investigador, para estudiar


sus efectos sobre la variable dependiente.

Nivel Del Factor: es cada una de las categorías, valores o formas específicas del factor.
Factor Cualitativo: sus niveles se clasifican por atributos cualitativos.
Factor Cuantitativo: sus niveles son cantidad numérica en una escala.
Factores Observacionales: El investigador registra los datos pero no interfiere en el proceso
que observa.
Factores Experimentales: El investigador intenta controlar completamente la situación
experimental.

7
Experimento Unifactorial: es aquel en el se estudia un solo factor.
Experimento Multifactorial: es aquel en el que se estudia simultáneamente
más de un factor.

Tratamientos: Conjunto de condiciones experimentales que serán impuestas


a una unidad experimental en un diseño elegido.
En experimentos unifactoriales, un tratamiento corresponde a un nivel de
factor.
En experimentos multifactoriales, un tratamiento corresponde a la
combinación de niveles de factores.
Unidad Experimental: es la parte más pequeña de material experimental
expuesta al tratamiento, independientemente de otras unidades.

8
Error Experimental: Describe la variación entre las unidades experimentales tratadas de
forma idéntica e independiente. Orígenes del error experimental:
•Variación natural entre unidades experimentales
•Variabilidad en la medición de la respuesta
•Imposibilidad de reproducir idénticas condiciones del tratamiento de una unidad a otra
•Interacción de tratamientos con unidad experimental
•Cualquier factor externo

Tratamiento Control: Un control al que no se le aplica tratamiento revelará las condiciones


en que se realiza el experimento.
•Mediciones: Son los valores de la variable dependiente, obtenidos de las unidades
experimentales luego de la aplicación de tratamientos.

9
Elementos Del Diseño De Experimentos
El diseño de experimentos se refiere a la estructura del experimento
considerando:
1. El conjunto de tratamientos incluidos en el estudio.
2. El conjunto de unidades experimentales utilizadas en el estudio.
3. Las reglas y procedimientos por los cuales los tratamientos son asignados
a las unidades experimentales (o viceversa).
4. Las medidas o evaluaciones que se hacen a las unidades experimentales
luego de aplicar los tratamientos.

10
Principios Básicos Del Diseño De Experimentos

1) Control Local: son las acciones empleadas por el investigador


para disminuir o controlar el error experimental
• Técnica
• Selección De Unidades Experimentales Homogéneas
• Bloquización
• Selección del Diseño Experimental Adecuado
• Utilizacion De Covariables
2) Replicación como un medio para estimar la varianza del error experimental
• Proporciona medias para estimar la varianza del error
experimental
• Permite aumentar la precisión para estimar las medias de los
tratamientos.
• Da seguridad contra resultados anormales por accidentes no
previstos.

11
Principios Básicos Del Diseño De Experimentos

3) Aleatorización para validar la estimación de la variancia del error


experimental.

Consiste en aplicar en forma aleatoria los tratamientos a las unidades


experimentales.

La aleatorización tiende a promediar entre los tratamientos cualquier efecto


sistemático presente de forma que las comparaciones entre tratamientos midan
sólo los efectos de los tratamientos mismos.

12
Análisis de Asociación
Análisis de Regresión vs. Análisis de Varianza

• Ambos análisis establecen relaciones entre variables.

• Estudian la relación estadística entre variables para tomar


decisiones.

• En el Análisis de regresión el objetivo es Predecir.

• Usa solo variables cuantitativas y la relación se expresa


con un modelo lineal en el cual la variable independiente
puede tomar cualquier valor fijado por el investigador .

13
Relaciones entre Análisis de Regresión y
Análisis de la Variancia

• En el Análisis de Variancia el objetivo es comparar los distintos


niveles de la ó las variables independientes ó factores para
establecer diferencias significativas en la variable dependiente ó
respuesta

• Difieren del modelo anterior en que las variables independientes


pueden ser cualitativas y que si son cuantitativas , en ANVA no se
hace ninguna presunción sobre la naturaleza de la relación
estadística entre variables dependientes e independiente.

14
Los Tipos de Modelos.

Los modelos experimentales de clasifican en tres tipos:


• De efectos fijos – MODELO I
• De efectos Aleatorios – Modelo II
• Mixtos.(Factores fijos y aleatorios)
Cuando el investigador tiene control sobre el material experimental aplicando sólo
los niveles de los factores que le interesan en el modelo, es de efectos fijos.
Cuando se investiga un factor pero no se tiene control sobre tratamientos, por
ejemplo en los estudios por muestreo, dónde los niveles que se aplican son una
muestra extraída al azar de una población de niveles, los modelos son de efectos
aleatorios.

15
ESTADÍSTICA
PARAMÉTRICA

Tres o más grupos: ANOVA de un factor


𝐻0 : 𝜇 1 = 𝜇 2 = 𝜇 3 …
𝐻1: 𝜇1 ≠ 𝜇2 ≠ 𝜇 3 …

Estadístico de prueba
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑒𝑛𝑡𝑟𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
𝐹=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠

• Si el valor p-valor (sig.) ≤ α , rechace la hipótesis nula de medias iguales y concluya que al
menos una de las medias poblacionales es diferente de las otras.
• Si el valor p-valor(sig.) > α, no rechace la hipótesis nula de medias iguales.
Ejemplo:
Un estudio compara los efectos de la vacuna X en cuatro muestras (niñ os,
adolescentes, adultos y ancianos) durante un mes. Presentamos las ventas
unitarias de 5 tiendas que utilizaron las 4 promociones en meses distintos:
Niños Adolescentes Adultos ancianos
78 94 73 79
87 91 78 83
81 87 69 78
¿Las promociones producen diferentes efectos sobre las ventas?
89 90 83 69
85 88 76 81
ANOVA
Suma de Media Factor
Resultado cuadrados df cuadrática F Sig. Bayesa
Entre grupos 612,150 3 204,050 9,694 0,001 51,532

Dentro de grupos 336,800 16 21,050     

Total 948,950 19       

a. Factor Bayes: JZS

Si el valor p-valor (sig.) ≤ α , rechace la hipótesis nula de medias 𝐻0: 𝜇1 = 𝜇2 = 𝜇3 …


iguales
Si el valor p-valor (sig.) > α , acepte la hipótesis nula de medias 𝐻1: 𝜇1 ≠ 𝜇2 ≠ 𝜇 3 …
iguales
Como sig(0,001) < alfa (0,05), se recha la H0, entonces se acepta H1, es decir los promedios son diferentes.
Prueba ANOVA de un factor: SPSS
Prueba ANOVA de un factor: SPSS
Prueba ANOVA de un factor: SPSS
Ejmplo 2.

• Parte de un estudio dirigido por el Instituto y


Universidad Estatal de Virginia se diseño para medir los
niveles de actividad del suero fosfatado alcalino (en
unidades de Bessey-Lowry) en niños con crisis
epilépticas que recibieron terapia anticonvulsiva al
cuidado de un médico. Para el estudio se reclutaron 45
sujetos y se clasificaron en 4 grupos, según el
medicamento:

06/08/2023 DISEÑO DE EXPERIMENTOS 22


G1: Control (no recibieron anticonvulsivos ni tenían historia de crisis
epilépticas.
G2: Fenobarbital
G3: Carbamazepina
G4: Otros antidepresivos
De las muestras de sangre tomadas de cada sujeto, se determino el
nivel de actividad del suero fosfatado alcalino y se regitró según se
observa en el cuadro. Pruebe la hipótesis de que con un nivel de
significancia de 0,05, el promedio del nivel de actividad del suero
fosfatado alcalino es el mismo para los cuatro grupos del
medicamento.

06/08/2023 DISEÑO DE EXPERIMENTOS 23


Tabla: Nivel de actividad del suero
fosfatado alcalino
G-1 G-2 G-3 G-4
49.20 97.07 62.10 110.60
44.54 73.40 94.95 57.10
45.80 68.50 142.50 117.60
95.84 91.85 53.00 77.71
30.10 106.60 175.00 150.00
36.50 0.57 79.50 82.90
82.30 0.79 29.50 111.50
87.85 0.77 78.40
105.00 0.81 127.50
95.22
97.50
105.00
58.05
86.60
58.35
72.80
116.70
45.15
70.35
77.40

Total 1460.25 440.36 842.45 707.41


06/08/2023 DISEÑO DE EXPERIMENTOS 24
Media 73.0125 48.9288889 93.6055556 101.058571
H 0 : 1   2   3   4
H 1 : Al menos dos de las medias son  s

H 0 : 1   2   3   4  0
H 1 : Al menos dos de los tratamientos
tienen efectos  s

06/08/2023 DISEÑO DE EXPERIMENTOS 25


Tabla : ANOVA de una dirección

Fuentes Variación Sumas Cuadrados g.L Cuadrados Fc P


Medios
Tratamientos 13939 3 4646 3,57 O,022
Error 53376 41 1302
Total 67315 44
ANOVA
Media
Resultado Suma de cuadrados Df cuadrática F Sig. Factor Bayesa
Entre grupos 13938,601 3 4646,200 3,569 0,022 0,521
Dentro de grupos 53376,297 41 1301,861     
Total 67314,899 44       
a. Factor Bayes: JZS
Como sig(0,022)<alfa(0,05); Se rechaza H0 , es decir el promedio del nivel de
actividad del suero fosfatado alcalino es el mismo para los cuatro grupos del
medicamento.
06/08/2023 DISEÑO DE EXPERIMENTOS 26
Tabla ANOVA: arreglo kxb para el Diseño de
BCA
Bloque :
Tratamiento 1 2 ... j ... b Total Media
1 Y11 Y12 ... Y1J ... Y1b T1.
2 ... ...
Y 1.
Y11 Y12 Y1J Y1b T2.
. . . ... . ... . .
Y 2.

. . . ... . ... . .
. . . ... . ... . .
i Yi1 Yi2 ... YiJ ... Yib Ti.
. . . ... . ... . . Y i.
. . . ... . ... . .
. . . ... . ... . .
K ... ...
Yk1 Yk2 YkJ Ykb TK.
Y k.
Total T.1 T.2 ... T.j ... T.b T..
Media ... ...
Y .1 Y .2 Y .j Y .b Y ..
06/08/2023 DISEÑO DE EXPERIMENTOS 27
Tabla de Análisis de varianza para
dos criterios de clasificación
Fuente de Suma de Grados de Cuadrados F calculada
variación Cuadrados libertad Medios  
Tratamientos SCTr t-1 CMTr = SCTr / t-1 CMTr / CME
Bloques SCB b -1 CMB = SCB / b-1 CMB / CME

Error Experim SCE (t - 1)(b-1) CME = SCE/(t-1)(b-1)


Total SCT t.b -1    

 ( yij  y..) 2  t  ( yi .  y..) 2  b ( y. j  y..) 2   ( yij  yi.  y. j  y.. ) 2


i j i j i j

Variación total Variación debida Variación debida Variación propia de


a los tratamientos a los bloques las observaciones
SST SSTr SSB SSE

06/08/2023 DISEÑO DE EXPERIMENTOS 28


Diseño en Bloques Completos
Aleatorizados
DBCA

29
Diseño De Bloques Completos Aleatorizados

• En muchos problemas de experimentos, es necesario


hacer un diseño de tal manera que la variabilidad
proveniente de fuentes conocidas pueda ser
sistemáticamente controlada.
• Se pretende reducir el efecto de la variabilidad
proveniente de causas propias del experimento pero
independiente del efecto que se desea estudiar.
• Para los fines del análisis de varianza el bloqueo
introduce un efecto adicional ficticio, cuyo objetivo es
separar del error experimental, alguna fuente de
variabilidad conocida.

30
Análisis De La Varianza: Clasificaciones según
dos Criterios

El Diseño en Bloque Completo al Azar es un plan en el cual las unidades


experimentales se asignan a grupos homogéneos, llamados bloques, y los
tratamientos son, luego, asignados al azar dentro de los bloques.
Objetivo del agrupamiento: lograr que las unidades dentro de un bloque
sean lo más uniformes posible con respecto a la variable dependiente, de
modo que las diferencias observadas se deban realmente a los tratamientos.
Al controlar la variación dentro de los bloques reducimos la variabilidad del
error experimental.
Completo: todos los tratamientos están incluidos en cada bloque.

31
Diseños En Bloques Aleatorizados

Cada bloque constituye una replicación.

Todos los tratamientos aparecen una


sola vez en cada bloque

32
Diseño En Bloques Completos
Aleatorizados

1. Se divide el material experimental en tantos bloques


como números de replicaciones a utilizar. Cada
bloque es luego dividido en tantas UE como
tratamientos haya en estudio.
2. Como el DBCA especifica que todos los tratamientos
deben aparecer una vez en cada replicación, la
aleatorización se hace separadamente en cada
bloque.
3. La aleatorización es similar al DCA para cada bloque.

33
Ejemplo: Para el ensamble de un artículo se considera
comparar 4 máquinas diferentes. Como la operación de las
máquinas requiere cierta destreza se anticipa que habrá una
diferencia entre los operarios en cuanto a la velocidad con la
cual operen la maquinaria. Se decide que se requerirán 6
operarios diferentes en un experimento de bloques
aleatorizado para comparar las máquinas.
Entonces, el factor de interés es uno sólo, pero se crea
otro factor para controlar la variabilidad extraña y
excluirla así del error experimental.
Aleatorización: debemos asignar cada tratamiento,
M1, M2, M3, y M4 a cada bloque.
34
Operario 1 Bloque 2 Bloque 3 Bloque 4 Bloque 5 Bloque 6

22 75 76 84 5 16
45 31 25 51 79 44
27 70 98 10 36 29
2 86 85 78 95 14

M2 M3 M2 M4 M1 M2
M4 M1 M1 M2 M3 M4
M3 M2 M4 M1 M2 M3
M1 M4 M3 M3 M4 M1

35
Si las máquinas no difieren en cuanto a la velocidad de ensamblado de la pieza,
tendrían igual velocidad promedio y las curvas se superpondrían exactamente.

H0 : µ1= µ2 = µ3= µ4 ó H0 = α1=α2=α3=α4=0


H1: algún promedio es distinto de los restantes
µ
Pero si las máquinas difieren en cuanto a la velocidad de ensamblado de la
pieza, pensaríamos que las muestras provienen de poblaciones diferentes.

µ1 µ2 µ3 µ4

36
EL MODELO (DE EFECTOS FIJOS)
Yij = µ + αi + βj + eij

Modelo lineal aditivo: cada respuesta es la suma de los otros términos.

Donde Y es la variable respuesta o dependiente, tiempo medido en


segundos, e Yij es la observación perteneciente al j-th bloque bajo el
tratamiento i; las observaciones son independientes.
µ: es la media general común a todas las máquinas y a todos los
operarios.
αi: es el efecto del tratamiento en el nivel i, propio de cada
máquina.
βj : es el efecto del bloque en el nivel j, propio de cada operario.
eij : es la variable aleatoria del error con distribución normal, con
media = 0 y varianza σ2 N (0 ; σ2 ) e independiente.
37
Medias marginales estimadas
Cuando el modelo es
aditivo quiere decir de Velocidad
que la diferencia en 48
respuestas medias
BLOQUE

M edias m arginales estim adas


entre dos operarios es 46
la misma para todas las 1
máquinas.
44 2

3
42

40
5

38 6
1 2 3 4

Tratamiento

38
Si aplicamos el Método de los Mínimos Cuadrados, para estimar los
parámetros

1 b t
ˆ ..  y.. = y Donde b son los bloques y t los
bt i 1 j 1 ij
tratamientos

̂ i = ˆ i. - ̂.. = yi. - y..

̂ j = ̂. j - ̂.. = y. j - y..

êij = yij - ̂.. - ̂ i - ̂ j = yij - yi. - y. j + y..

Cada componente del modelo contribuye a la variabilidad total. La


partición de la Suma de Cuadrados Total involucrará tres fuentes de
variación.
39
Tabla de Análisis de varianza para dos
criterios de clasificación

Fuente de Suma de Grados de Cuadrados F calculada


variación Cuadrados libertad Medios  
Tratamientos SSTr t-1 SMTr = SSTr / t-1 SMTr / CME
Bloques SSB b -1 SMB = SSB / b-1 SMB / CME

Error Experimental SSE (t - 1)(b-1) SME = SSE / (t-1)(b-1)


Total SST t.b -1    

 ( yij  y..) 2  t  ( yi .  y..) 2  b ( y. j  y..) 2   ( yij  yi.  y. j  y.. ) 2


i j i j i j

Variación total Variación debida Variación debida Variación propia de


a los tratamientos a los bloques las observaciones
SST SSTr SSB SSE

40
Tiempo en segundos para el
ensamble del producto
  Operario    
Máquina 1 2 3 4 5 6 Total Medias
1 42,5 39,3 39,6 39,9 42,9 43,6 247,8 41,3
2 39,8 40,1 40,5 42,3 42,5 43,1 248,3 41,4
3 40,2 40,5 41,3 43,4 44,9 45,1 255,4 42,6
4 42,3 43,2 44,5 45,2 46,9 43,3 265,4 44,2
Total 164,8 163,1 165,9 170,8 177,2 175,1 1016,9  
Fc =
Medias 41,2 40,775 41,475 42,7 44,3 43,775 254,225 42,4
  Yij  2
i j
Factor de Corrección = b.t
1 2
Suma de Cuadrados Tratamientos =  Ti.  Fc
1 b i
2
Suma de Cuadrados de Bloques =  T. j  Fc
t j
 Yij2  Fc
Suma de Cuadrados Total = i j

Suma de Cuadrados del Error = SCTotal – SCTratamiento - SCBloque


41
Ejmplo 5.

• Parte de un estudio dirigido por el Instituto y


Universidad Estatal de Virginia se diseño para medir los
niveles de actividad del suero fosfatado alcalino (en
unidades de Bessey-Lowry) en niños con crisis
epilépticas que recibieron terapia anticonvulsiva al
cuidado de un médico. Para el estudio se reclutaron 45
sujetos y se clasificaron en 4 grupos, según el
medicamento:

06/08/2023 DISEÑO DE EXPERIMENTOS 42


G1: Control (no recibieron anticonvulsivos ni tenían
historia de crisis epilépticas.
G2: Fenobarbital
G3: Carbamazepina
G4: Otros antidepresivos
De las muestras de sangre tomadas de cada sujeto, se
determino el nivel de actividad del suero fosfatado
alcalino y se regitró según se observa en el cuadro.
Pruebe la hipótesis de que con un nivel de significancia
de 0,05, el promedio del nivel de actividad del suero
fosfatado alcalino es el mismo para los cuatro grupos del
medicamento.
06/08/2023 DISEÑO DE EXPERIMENTOS 43
Tabla: Nivel de actividad del suero
G-1 G-2 G-3 G-4 fosfatado alcalino
49.20 97.07 62.10 110.60
44.54 73.40 94.95 57.10
45.80 68.50 142.50 117.60
95.84 91.85 53.00 77.71
30.10 106.60 175.00 150.00
36.50 0.57 79.50 82.90
82.30 0.79 29.50 111.50
87.85 0.77 78.40
105.00 0.81 127.50
95.22
97.50
105.00
58.05
86.60
58.35
72.80
116.70
45.15
70.35
77.40
Total 1460.25 440.36 842.45 707.41
Media 73.0125 48.9288889 93.6055556 101.058571

06/08/2023 DISEÑO DE EXPERIMENTOS 44


H 0 : 1   2   3   4
H 1 : Al menos dos de las medias son  s

H 0 : 1   2   3   4  0
H 1 : Al menos dos de los tratamientos
tienen efectos  s

06/08/2023 DISEÑO DE EXPERIMENTOS 45


Tabla : ANOVA de una dirección
Fuentes Sumas Cuadrados g.L Cuadrados F P
Variación Medios
Tratamien 13939 3 4646=(I) Fo=3,57 O,022
tos
Error 53376 41 1302=(II)

Total 67315 44

Como P=0,022<0,05=α; Se rechaza H0 , es decir que los


agrados no tienen la misma media de absorción. Aza

06/08/2023 DISEÑO DE EXPERIMENTOS 46


Tabla ANOVA: arreglo kxb para el Diseño de BCA

Bloque :
Tratamiento 1 2 ... j ... b Total Media
1 Y11 Y12 ... Y1J ... Y1b T1.
2 ... ...
Y 1.
Y11 Y12 Y1J Y1b T2.
. . . ... . ... . .
Y 2.

. . . ... . ... . .
. . . ... . ... . .
i Yi1 Yi2 ... YiJ ... Yib Ti.
. . . ... . ... . . Y i.
. . . ... . ... . .
. . . ... . ... . .
K ... ...
Yk1 Yk2 YkJ Ykb TK.
Y k.
Total T.1 T.2 ... T.j ... T.b T..
Media ... ...
Y .1 Y .2 Y .j Y .b Y ..
06/08/2023 DISEÑO DE EXPERIMENTOS 47
Tabla de Análisis de varianza para dos criterios
de clasificación
Fuente de Suma de Grados de Cuadrados F calculada
variación Cuadrados libertad Medios  
Tratamientos SCTr t-1 CMTr = SCTr / t-1 CMTr / CME
Bloques SCB b -1 CMB = SCB / b-1 CMB / CME

Error Experim SCE (t - 1)(b-1) CME = SCE/(t-1)(b-1)


Total SCT t.b -1    

 ( yij  y..) 2  t  ( yi .  y..) 2  b ( y. j  y..) 2   ( yij  yi.  y. j  y.. ) 2


i j i j i j

Variación total Variación debida Variación debida Variación propia de


a los tratamientos a los bloques las observaciones
SST SSTr SSB SSE

06/08/2023 DISEÑO DE EXPERIMENTOS 48


ANOVA BIDIRECCIONAL : CON
INTERACCION
• Ejemplo. Se desea probar si hay alguna diferencia en la
producción promedio entregada por tres máquinas. El
gerente sospecha que la respuesta puede depender
del cuál de cuatro grupos de personal opere las
máquinas, y que incluso puede haber una interacción
tal que un grupo de personal resulte más productivo
con una máquina (más bien que un grupo sea
consistentemente mejor o peor que otro, cualquiera
que sea el tipo de máquina).

06/08/2023 49
• Dicha situación requiere de un experimento con el
diseño aleatorio por bloques, pero para probar la
interacción se requieren al menos dos observaciones
para cada combinación de tratamientos (máquinas) y
bloques (grupos de personal). Un experimento
apropiado en el que se hacen precisamente dos
observaciones para cada una de estas combinaciones,
puede producir los resultados de la siguiente tabla:

06/08/2023 50
DISEÑO ALEATORIO POR BLOQUES: CON INTERACCION
Tratamiento j (tipo de máquina) Totales por Medias por
Bloque, i (grupo) 1 2 3 Bloque Bloque

50 Ttot =98 42 Ttot =88 43 Ttot =88


(A) 48 Med=49 46 Med=44 45 Med=44 274 45,67

56 Tot =114 38 Tot =70 40 Tot =78


(B) 58 Med=57 32 Med=35 38 Med=39 262 43,67

51 Tot =106 39 Tot =72 42 Tot =82


(C) 55 Med=53 33 Med=36 40 Med=41 260 43,33

40 Tot=78 47 Tot=98 45 Tot=84


(D) 38 Med=39 51 Med=49 39 Med=42 260 43,33

Totales por columna 396 328 332


Medias por columna 49,5 41 41,5
Gran media (49,5+41+41,5)/3 =44 o
(45,67+43,67+43,33+43,33)/4 = 44 o
(49+44+44)+(57+35+39)+(53+36+41)+(39+49+42)/12 =44

• Este diseño permite al analista probar tres


hipótesis nulas en forma simultaneas
06/08/2023 51
2. Probar esta primera hipótesis ayuda al
gerente a decidir, que tipo de máquina
comprar en el futuro.
H0: El número promedio de unidades
producidas es el mismo con cada tipo de
máquina, esto es, μ1=μ2=μ3
H1: Al menos una de estas medias
poblacionales es diferente de las otras.

06/08/2023 52
2. Probar esta segunda hipótesis ayuda al
gerente a decidir, sueldos promociones o
despidos, μA=μB=μC =μD
H0: El número promedio de unidades
producidas es el mismo con cada grupo
de personal.
H1: Al menos una de estas medias
poblacionales es diferente de las otras.

06/08/2023 53
3. Probar esta tercera hipótesis ayuda al
gerente a decidir, una asignación mejor
de grupos particulares a varias
máquinas.
H0: Máquinas y grupos de personal no
interactúan con respecto al número
promedio producido
H1: Hay interacción entre máquinas y
grupos de personal.

06/08/2023 54
Variación entre columnas: Explicada por Tratamientos
 
SST  rb  Y j  Y..   2(4) (49,5  44) 2  (41  44) 2  (41,5  44) 2  364
2

r: número de observaciones por celda.


b: número de bloques.
c: número de tratamientos

Variación entre Renglones: Explicada por Bloques


SSB  rc  Yi  Y.. 
2

 
 2(3) (45,67  44) 2  (43,67  44) 2  (43,33  44) 2  (43,33  44) 2  22,67

06/08/2023 55
Variación Explicada por Interacción
SSI  r  Yij  Yi  Y j  Y.. 
2


 2 (49  45.67  49.5  44) 2  (44  45,67  41  44) 2
 (44  45,67  41,5  44) 2  (57  43,67  49,5  44) 2
 (35  43,67  41  44) 2  (39  43,67  41,5  44) 2
 (53  43,33  49,5  44) 2  (36  43,33  41  44) 2
 (41  43,33  41,5  44) 2  (39  43,33  49,5  44) 2
 (49  43,33  41  44) 2  (42  43,33  41,5  44) 2   629,33

06/08/2023 56
Variación debida al TOTAL
SST  (50  44) 2  (48  44) 2  ...  (39  44) 2  1106

Variación debida al error

SSE  SST  SSTrat  SSB  SSI


SSE  1106  364  22,67  629,33  90

06/08/2023 57
Tabla ANOVA Bidireccional con Interacción
Fente de Suma de Cuadrados Grados de Libertad Cuadrado Estadística de
variación (1) (2) Medio prueba
(3)=(1)/(2)

Tratamientos SSTat=364,00 c-1=2 182 FT= 24,27

Bloques SSB=22,67 b-1=3 7,56 FB=1,01

Interacción SSI=629,33 (C-1)(B-1)=6 104,89 FI=13,99

Error SSE=90 bc(r-1)=12 7,5

Total SST=1 106 (bcr)-1=23

• F(2;12)0,01=6,83
• F(3;12)0,01=5,95
• F(6;12)0,01=4,82
• Pueden tomar la decisión FINAL

06/08/2023 58
• REPRESENTACIÓN SIMBÓLICA DE LOS DATOS
• En el supuesto que se tienen "a"
tratamientos y se han seleccionado “b”
bloques y llevado a cabo una réplica
completa del experimento en cada uno
de los bloques. La representación típica de
los datos para este tipo de Diseño es la
siguiente:

06/08/2023 59
06/08/2023 60
06/08/2023 61
06/08/2023 62
06/08/2023 63
• Por lo tanto:
• SST = SSTratamientos + SSBloques + SSE
• donde
• SST : Tiene N-1 grados de libertad, porque existen N observaciones en total
y un sólo
• parámetro a estimar que es µ .
• SSTratamientos : Tiene a-1 grados de libertad, porque existen “ a ” niveles
del factor y un solo parámetro a estimar que es ιi .
• SSBloques : Tiene b-1 grados de libertad, porque existen “ a ” bloques y
un sólo parámetro a estimar que es βj .
• SSE : Tiene (a-1)(b-1) grados de libertad, porque existen ab celdas que
proporcionan ab-1 grados de libertar y la suma de cuadrados del error no
es mas que la suma de cuadrados entre las celdas, menos la suma de
cuadrados de tratamiento y la suma de cuadrados de bloques; entonces los
grados de libertad del error serán: ab-1-(a-1)-(b-1) = (a-1)(b-1).
• Los grados de libertad de la suma total debe ser igual a la suma de
los grados de libertad de SSTratamientos , SSBloques y SSE; es decir, N-1
= (a -1)+( b-1)+( a-1)( b-1) = ab-1.
06/08/2023 64
• Matemáticamente estas sumas se obtienen de la siguiente manera:

06/08/2023 65
Las medias de cuadrados o cuadrados medios, que se
definen en función de las sumas de cuadrados y los grados
de libertad; es decir, cada suma de cuadrados dividida entre
sus grados de libertad es igual a una media de cuadrados.

06/08/2023 66
Matemáticamente se expresan de la manera siguiente:

06/08/2023 67
06/08/2023 68
• Ejemplo 2
• Se probaran 5 raciones respecto a sus diferencias
en el engorde de novillos. Se dispone de 20 novillos
para el experimento, que se distribuyen en 4
bloques (5 novillos por bloque) con base a sus
pesos, al iniciar la prueba de engorde. Los 5
tratamientos (raciones) se asignaron al azar dentro
de cada bloque. Los novillos más pesados se
agruparon en un bloque, en otro se agruparon
los 5 siguientes más pesados y así sucesivamente.
Se obtuvieron los siguientes datos:

06/08/2023 69
06/08/2023 70
• Datos
• Tratamientos: a = 5 , Bloques : b = 4
• Número total de observaciones: N = 5x4 = 20
• i = 1,2,3,4,5 , j = 1,2,3,4
• Para que los cálculos matemáticos resulten más fáciles, la
siguiente tabla muestra los datos de la tabla anterior codificados
(restándoles 1 y multiplicando el resultados por 10).

06/08/2023 71
06/08/2023 72
06/08/2023 73
06/08/2023 74
06/08/2023 75
06/08/2023 76
06/08/2023 77
• Conclusión
• Las cinco raciones no son igualmente efectivas en el engorde de
novillos o la cantidad de ración influye significativamente en el
engorde de los novillos.

06/08/2023 78
06/08/2023 79
06/08/2023 80
06/08/2023 81
06/08/2023 82
06/08/2023 83
• Se considera que la adición de Co puede incrementar la resistencia a
la tensión del acero y se experimenta con 4 niveles de Co, pero el tipo
de horno en que se hace la fundición se cree que produce
variabilidad, asi que se usa como bloque, se hacen dos medidas en
cada bloque con cada nivel de Co, la tabla muestra los resultados de
resistencia a la tensión en miles de PSI

06/08/2023 84
06/08/2023 85
• Ahora repita el análisis y en este caso no considere las repeticiones
para efectos de cálculo si no que calcule los promedios de ellos y
tomelos como lecturas únicas, compare los resultados.

06/08/2023 86
Problema 7

06/08/2023 87
𝐻 0: 𝜇 1 = 𝜇 2 = 𝜇 3 …
𝐻1: 𝜇1 ≠ 𝜇2 ≠ 𝜇 3 … Solución Problema 7
ANOVA
Suma de Media Factor
Resultado cuadrados df cuadrática F Sig. Bayesa
Entre grupos 1135,000 3 378,33329,790 0,000 34835,715
Dentro de grupos 203,200 16 12,700     

Total 1338,200 19       


a. Factor Bayes: JZS
Si el valor p-valor (sig.) ≤ α , rechace la hipótesis nula de medias
iguales
Si el valor p-valor (sig.) > α , acepte la hipótesis nula de medias
iguales
Como sig(0,000) < alfa (0,05), se recha la H0, se acepta H1, es decir las
medias de los tratamientos son diferentes. 3,24 29,79
Fα Fc
Del gráfico: Como Fc está en la región de rechazo, se rechaza H0, se acepta H1,
es decir las medias de los tratamientos son diferentes.
SC entre (a  1)
gl numerador (trat - 1) Fc = SC dentro (n  a)
gl denominador (n - trat)
06/08/2023 90
06/08/2023 91
• comprobar el efecto que tienen cinco
Una industria desea
productos químicos sobre la resistencia de un tipo particular
de fibra. Como también puede influir la máquina empleada
en la fabricación, decide utilizar un diseño en bloques
aleatorizados, considerando las distintas máquinas como
bloques. La industria dispone de 4 máquinas a las que asigna
los 5 productos químicos en orden aleatorio. Los resultados
obtenidos se muestran en la tabla adjunta.
Maquina
Producto A B C D
1 87 86 88 83
2 85 87 95 85
3 90 92 95 90
4 89 97 98 88
5 99 96 91 90
06/08/2023 92
• Un investigador examinó los efectos de tres tipos de
fertilizante orgánico en un estudio de recuperación de
tres tipos de suelos erodados y determinó la
estructura del suelo expresada en incremento de la
estabilidad de un cubo se suelo con respecto al suelo
original,. El investigador piensa que suelos de parcelas
contiguas le darán resultados similares por lo que
utiliza ese criterio como criterio de bloqueo.los
resultados están consignados en la siguiente tabla

06/08/2023 93
TIPO DE BLOQUES
ABONO
1 2 3 4 5 6 7
A 35.4 34 38 35.8 33.5 37.6 35.5
B 33 32 37 34.5 32.7 36 36
C 24 23.8 28 23.4 24 25 24

06/08/2023 94
DIRECTRICES O PROCEDIMIENTO PARA EL
DISEÑO EXPERIMENTAL.

• Se considera necesario que todos los participantes que realizan


un enfoque estadístico en el cual se diseña y analiza un
experimento tengan de antemano una idea clara de lo qué es
exactamente lo que se va a estudiar; es decir, como se van ha
recopilar los datos, y como se van a analizar.

06/08/2023 95
guía del procedimiento a seguir
• Primero: Reconocimiento y Planeamiento del problema.
• Es necesario desarrollar todas las ideas sobre los objetivos del
experimento. Una clara comprensión y planteamiento del
problema con frecuencia contribuye sustancialmente a un mayor
entendimiento del fenómeno y a la solución final del problema.
• Suele ser importante solicitar la opinión de todas las partes
implicadas; ya que normalmente saben mucho del problema.

06/08/2023 96
• Segundo: Elección de Factores y Niveles.
• Se deben seleccionar los factores que van a ser
investigados en el experimento, los intervalos de
variación y los niveles específicos a los cuales se
hará el experimento. Además debe considerarse
la forma en que se controlarán estos
factores para mantenerlos en los valores deseados y
como se les medirá.

06/08/2023 97
• Tercero: Selección de la Variable Respuesta.
• El experimentador debe seleccionar la variable
respuesta o variable dependiente de tal forma que
esté seguro que la respuesta, que se va a medir,
realmente proporcione información útil a cerca del
problema en estudio.
• Las respuestas en un problema pueden ser
múltiples. Por ejemplo, en el experimento de
eficacia de seis fertilizantes de nitrógeno para
cierta variedad de maíz (analizado anteriormente),
la variable respuesta es el rendimiento.
06/08/2023 98
• En general, un experimento de este tipo puede
tener simultáneamente otras variables respuestas;
como por ejemplo altura de plantas,
determinación del contenido de humedad de las
semillas, color de las semillas, etc. Pero en este
momento se habla solamente del rendimiento, el
cual se considera que es la variable de interés mas
importante para el investigador.

06/08/2023 99
• Cuarto: Elección del Diseño Experimental.
• Para definir o determinar el diseño experimental a utilizar se debe
considerar el tamaño muestral (número de repeticiones), seleccionar un
orden adecuado para los ensayos experimentales y determinar si hay
implicaciones de bloque u otras restricciones de aleatorización. Además tener
presente los objetivos experimentales.
• El investigador debe decidir qué constituye una unidad experimental, cuántas
réplicas de las unidades experimentales exige cada tratamiento y qué
tratamiento asignar a cada una de ellas. También, debe determinar si
agrupará por bloques las unidades experimentales en grupos
homogéneos para controlar el error experimental.
• Con base al Diseño Experimental debe proponerse un Modelo Matemático
adecuado.
06/08/2023 100
• Quinto: Ejecución del Experimento.
• En esta fase se lleva a cabo la recolección
de los datos. Se debe observar
cuidadosamente el proceso para asegurar que todo
se realice conforme lo planteado; ya que los errores
en el procedimiento suelen anular la validez del
experimento.

06/08/2023 101
• Sexto: Análisis de los Datos.
• Se deben utilizar métodos estadísticos para analizar
los datos, para que los resultados y conclusiones
sean objetivos más que apreciativos. Si todo se ha
realizado correctamente los métodos estadísticos que
se necesitan no son complicados.

06/08/2023 102
• Séptimo: Conclusiones y Recomendaciones.
• Consiste en la interpretación de las inferencias
estadísticas. Y para llevar a cabo la presentación
de los resultados son muy útiles los métodos
gráficos, en especial cuando se presentan a otros
personas. Es bien importante también realizar
corridas de seguimiento y pruebas de
confirmación para llevar a cabo la validación
de las conclusiones del experimento.

06/08/2023 103
GRACIAS

También podría gustarte