Está en la página 1de 26

Análisis de la Covarianza

Métodos Avanzados en
Control de Calidad
Diseño Experimental

Master Organización Industrial y Gestión de Empresas

1
Indice
1. Introducción
2. Análisis de la Covarianza
3. Caso práctico
4. Aplicaciones

2
1. Introducción
Se elimina la variación debida a la/s
Covariable/s de la estimación de la varianza
del error y se la evalúa como un efecto
principal separado
• Este procedimiento es la combinación de las técnicas:
– Análisis de la Varianza
– Análisis de Regresión
• Objetivos
Estudiar la relación de una variable cualitativa (factor) con
una variable cuantitativa (covariable).

La variable cualitativa (t) recibe el nombre de La variable cuantitativa (X) recibe el nombre de
factor, dicha variable es controlada por el covariable y no es controlada por el experimentador
experimentador y se presenta a varios pero puede medirla al mismo tiempo que la variable
niveles respuesta (Y: variable dependiente)
3
2. Análisis de la Covarianza
• Análisis de la Covarianza Unifactorial

• Modelo Unifactorial con una covariable

• Diseños en bloques completos aleatorios con una covariable

• Diseños en bloques completos aleatorios con dos covariables

• Diseños factoriales con dos factores y una covariable.

• Diseño factoriales con dos factores y dos covariables

4
2.1. Análisis de la Covarianza Unifactorial
Describe a una situación que involucra:
– Una variable independiente cualitativa con diversos niveles.
– Una o más covariables (variables independiantes cuantitativas )

•Modelo Unifactorial con una covariable


En un diseño con un solo factor y una sola covariable, si se supone que existe relación lineal entre la
variable respuesta y la covariable:

ti: Es el efecto producido por el tratamiento i-ésimo


b: Es el coeficiente de regresión lineal que representa la cantidad en que varia la variable respuesta por
cada cambio unitario de la covariable.
xij: Es el valor de la covariable correspondiente a la observación yij.
:es la media de la covariable

5
2.1.1. Modelo Unifactorial con una covariable

En un diseño completamente aleatorizado la suma total de cuadrados


puede descomponerse en suma de cuadrados entre tratamientos y en
suma de cuadrados residual.

6
2.1.1. Modelo Unifactorial con una covariable

A.- Contraste de hipótesis


1. Todos los niveles del factor producen el mismo efecto (Ho: ti = 0 ∀i) vs (H1: ti
≠ 0 por lo menos para algún i).
2. El coeficiente de regresión b es 0
H o: b = 0
H 1: b ≠ 0
B.- Contraste de los efectos del factor
El estadístico de contraste para contrastar la hipótesis nula Ho: ti = 0 ∀i es:
 

Se rechazará Ho cuando Fexp > al nivel de significación a


 
7
2.1.1. Modelo Unifactorial con una covariable
C.- Contraste del coeficiente de regresión (b)
El estadístico de contraste para contrastar la hipótesis nula Ho: b = 0 viene dada por la
expresión:
Si este valor es mayor que el valor teórico al nivel de significación de a se rechaza la hipótesis
de que el coeficiente de regresión es igual a 0.

8
Diseño en bloques completos aleatorios con una covariable

El modelo estadístico para este diseño es:

Siendo
ti el efecto producido por el nivel i-ésimo del factor principal ( )
gj el efecto producido por el nivel j-ésimo bloque ( )
b es el efecto (ij)-ésimo valor observado en la covariable

9
Diseño en bloques completos aleatorios con una covariable

Las Sumas de Cuadrados y productos Cruzados tienen las


siguientes expresiones:

10
Diseño en bloques completos aleatorios con una covariable

11
Diseño en bloques al azar con dos covariables

Modelo estadístico

12
Diseños factoriales con dos factores y una covariable

• Modelo estadístico
Consideramos un diseño unifactorial equilibrado con dos factores,
supongamos que hay a niveles para el factor A y b niveles del factor
B y cada réplica del experimento contiene los ab tratamientos
posibles

Siendo
r: nº de replicaciones
(tg)ij: el efecto producido por la interacción entre A y B.

13
Diseño factoriales con dos factores y dos covariables

Modelo estadístico

Siendo
r: nº de replicaciones
(tg)ij: el efecto producido por la interacción entre A y B.

14
Caso práctico
Se tiene ocho variedades de fresas (A, B, C, D, E, F, G y H) sembra-
das a lo largo de cuatro franjas de un terreno. Cada franja se ha divi-
dido en ocho parcelas donde se siembran las ocho variedades de
fresa. No se tiene seguridad de que el terreno sea igual de fértil en
todas las franjas, por lo que la cantidad de fresas recolectada podría
depender de la franja en la que se siembra.

Además, en el límite este del terreno hay un seto que podría quitar
elementos de tierra beneficiosas para las fresas, influyendo de alguna
manera en la cosecha recogida.

Los datos de los kilos recolectados y la distribución del cultivo de las


fresas en terreno se representan a continuación en la tabla 1
15
Caso práctico

A B C D E F G H
I
5.8 6.3 4.9 6.5 4.5 5.2 6.5 3.8
G H F E A B D C
II
6.9 7.6 7.9 5.6 7 5.5 4 2.7
Franja Seto
B D C A H G E F
III
7.6 6.4 5 6.9 7.4 5.3 5.2 3.2
G E F H A D B C
IV
7.5 7 6.1 7.2 6.5 5.6 5.8 1.4
Distancia al
8 7 6 5 4 3 2 1
seto m

Tabla 1
16
Caso práctico
Se pide:
1. Describir el problema planteado, identificando los elementos.
2. Escribir el modelo matemático asociado donde se introduzca el
inverso de la distancia al seto como variable concomitante.
3. ¿Es necesario controlar la influencia de esta variable? ¿Es el
terreno igual de fértil en todas las franjas?
4. Analizar las diferencias entre las ochos variedades de fresas. De
existir diferencias entre las cantidades recolectadas, decidir por el
método de Bonferroni cuáles son las variedades de las que recoge
más cosecha.

17
Caso práctico

18
Caso práctico

La variable respuesta que se mide es el


“número de kilos recogidos de cada va-
riedad de fresa”. El factor de interés es
la variedad de fresa. Las unidades ex-
perimentales son las parcelas, a las que
se les anota el número de kilos recogi-
dos de fresa.

El hecho de que las franjas de terreno


puedan influir sobre las cosechas, hace
que se deba incluir también el seto, se
tomará como posible variable concomi-
tante el inverso de la distancia al seto.
Así los tratamientos son los ochos tipos
de fresa.

19
Caso práctico
El modelo matemático asociado a esta situación es:

yij = m + ai + gj + b(xij – ..) + eij ; i=1, … , 8; j=1, … , 4

eij ≈ N(0,σ) independientes

yij: kilos de fresa de variedad i recolectados en la franja j.


xij: inverso de la distancia al seto de la parcela de la franja j donde se siembra la fresa i.
m: número medio de kilos recolectados.
ai: efecto medio adicional sobre la cosecha media de la variedad de fresa i.
gj: efecto medio adicional sobre la cosecha media de la franja j.
b: influencia de la distancia al seto sobre la cosecha media.
Así, yij ≈ N(m + ai + gj + b(xij – ), σ) independientes

20
Caso práctico
Para realizar el estudio de la varianza se comprueba
• Normalidad
• Homocedasticidad
yij ~ N (µ+αi ,σ)
Para verificar si se trata o no de una distribución Normal se
realiza un contraste Chi-cuadrado
A continuación, vamos a verificar la condición de
Homocedasticidad mediante un Contraste de Varianza.

21
Caso práctico

Por lo tanto, P-valor > 0,10.


Así que, no se rechaza H0 al nivel del 10% de
significación. De este modo, podemos concluir que
la distribución es normal.

22
Caso práctico
¿Es el terreno igual de fértil
3.- ¿Es necesario controlar la influencia de esta variable?
en todas las franjas?

p-valor asociado a la variable


concominante es 0,0000.
El inverso de la distancia al seto
influye sobre la cantidad de fresa
recolectada.
Si es necesario incluir en el
análisis la distancia al seto.

Sin embargo, las franjas de


terreno no son influyentes
sobre las cosechas recogidas,
lo que hace suponer que
todas ellas son igual de
fértiles.
23
Caso práctico

4.- Analizar las diferencias entre las 8 variedades de fresas

Se replantea el modelo, suprimiendo


del mismo el factor bloque.
La variable concominate (INV_SETO)
es significativa e influye sobre la
cosecha recogida.

Con respecto a las diferencias entre


las variedades de fresa, obtenemos
un (p-valor)fresa=0,0110 < a, siendo
significativa las diferencias a un
nivel del 95%, pero no al 99%.
24
Caso práctico

4.- Analizar las diferencias entre las 8 variedades de fresas

Las diferencias encontradas entre las


cantidades medias recogidas de las
variedades son C y H.

Y de la cosecha que más se recoge es


de la variedad H, siendo su media 6.7.

25
Aplicaciones
 Efecto de fertilizantes en el estudio de las plantas
 Efecto de formas nuevas de promoción en la venta de sus vinos en supermercados.
 Las formas de promoción son: Degustaciones, Aumento de espacio en los estantes, Muestrarios en los extremos del
pasillo
 Efecto de las dietas en cerdos de la misma edad
 Efecto de la renta, según zona geográfica, pero ajustando previamente por variables cuantitativas como la protección
social (covariable).
 Efecto de las horas trabajadas según la educación y sexo.
 Efecto de reducir las diferencias salariales entre hombres y mujeres al asistir a los cursos de formación que antes han
sido planificados.
 Efecto de la religión en la actitud hacia el divorcio según nivel educacional
 Efecto de los métodos de enseñanza en el rendimiento según habilidades de los alumnos (cov).
 Efecto de documentales en el deseo de viajar a la Patagonia.
 Efecto de corregir resultados observados de conocimientos iniciales sobre una materia determinada.
 Efecto de comparar rendimientos en un proceso químico según los porcentajes de impureza en la materia prima a
diversas temperaturas.
 Efecto de distintos métodos de aprendizaje en los alumnos.
 Efecto de métodos de adelgazamiento en pacientes.
 Efecto de un tratamiento y efecto de una o más variables de confusión potenciales según puntuaciones previas a la
prueba, edad, educación, nivel social y nivel de ansiedad.
 Efecto de la hipertensión según la edad y sexo.
 Efecto en la producción al utilizar diferentes insecticidas en un cultivo de patatas.

26

También podría gustarte