Está en la página 1de 41

Universidad de la Amazonia

Facultad de Ingeniería
Programa Ingeniería Agroecológica

SUPUESTOS DEL ANALISIS DE


VARIANZA

DIANA MARÍA SÁNCHEZ OLAYA


INGENIERA AGROECÓLOGA
MG. EN AGROFORESTERÍA
SUPUESTOS DEL ANAVA

Los supuestos del ANAVA implican:


- Errores independientes,
- Normalmente distribuidos y con
- Varianzas homogéneas para todas las observaciones.

2
SUPUESTOS DEL ANAVA
La verificación de los supuestos se realiza en la práctica a través
de los predictores de los términos de error aleatorio que son
los residuos aleatorios asociados a cada observación.

El residuo asociado a la observación ij-


ésima (simbolizado como eij) es la
diferencia entre el valor observado y
el valor predicho por el modelo para
la respuesta en la unidad
experimental ij-ésima

3
SUPUESTOS DEL ANAVA

Por lo general, en la práctica, los supuestos del ANAVA no se


cumplen con exactitud. En caso de que haya evidencia de faltas
graves de cumplimiento de los supuestos, el modelo y/o la
estrategia de análisis podría no ser adecuado.

4
Se realizó un experimento donde se evaluaron cuatro híbridos de maíz sobre el
rendimiento en kg/ha. Para ello se utilizaron 10 repeticiones por cada híbrido. La unidad
experimental consistió en parcelas de terreno de 5m de ancho por 5m de largo.

5
6
7
La variable
dependiente es la
variable que se desea
examinar (variable
respuesta)

8
Las variables de
clasificación son las
variables que
representan factores o
fuentes de
variación que permiten
separar o clasificar las
observaciones del
archivo en grupos.

9
10
11
12
VERIFICACIÓN DE SUPUESTOS DEL ANAVA

- Normalidad

Seleccionando los residuos como variable de análisis, una de las


técnicas más usadas es construir un Q-Q plot normal. Mediante
esta técnica se obtiene un diagrama de dispersión de los
residuos obtenidos versus los cuantiles teóricos de una
distribución normal. Si los residuos son normales y no hay otros
defectos del modelo, se alinearán sobre una recta a 45°.

13
14
Si los residuos son normales
y no hay otros defectos del
modelo, se alinearán sobre
una recta a 45°.

Figura 1: Q-Q plot (normal) obtenido a partir de un modelo con errores normales.
15
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Normalidad

Otra opción es realizar una prueba de hipótesis sobre


normalidad, seleccionando los residuos como variable de
análisis se obtiene el estadístico W* de Shapiro-Wilks.

Las hipótesis que se someten a prueba son:


Ho: los residuos tienen distribución normal versus
Ha: los residuos no tienen distribución normal.
16
17
p(Unilateral D)>0,05:
Ho: los residuos tienen distribución normal.

p(Unilateral D)<0,05:
Ha: los residuos no tienen distribución normal.

En este caso no hay evidencias para rechazar el supuesto de


distribución normal (p=0,2975).
18
VERIFICACIÓN DE SUPUESTOS DEL ANAVA

- Homogeneidad de varianzas

Cuando los errores son homocedásticos, haciendo un gráfico de


dispersión de residuos versus valores predichos se debe observar
una nube de puntos sin patrón alguno (patrón aleatorio).

Si el gráfico muestra estructura habrá indicios para sospechar


sobre el cumplimiento del supuesto.

19
20
Se debe observar una nube de puntos
sin patrón alguno (patrón aleatorio).

Figura 2: Gráfico de residuos en función de predichos.


21
Patrones de comportamiento de la gráfica residuos vs. predichos
22
Patrones de comportamiento de la gráfica residuos vs. predichos
23
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Homogeneidad de varianzas

Otra estrategia para la validación del supuesto de


homocedasticidad para el factor tratamientos, es la prueba de
Levene.

La prueba consiste en realizar un análisis de la varianza usando


como variable dependiente el valor absoluto de los residuos. Este
análisis se debe realizar con un modelo a una vía de clasificación.

24
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Homogeneidad de varianzas

Las hipótesis que se someten a prueba son:


Ho: todas las varianzas son homogéneas versus
Ha: al menos dos varianzas son distintas.

Si el valor p del factor tratamiento de este ANAVA es menor al


valor de significación nominal se rechaza la hipótesis de varianzas
homogéneas, caso contrario el supuesto de igualdad de varianzas
puede ser sostenido.
25
26
p-valor tratamiento > 0,05: Ho: todas las varianzas son homogéneas
p-valor tratamiento < 0,05: Ha: al menos dos varianzas son distintas
En este caso las varianzas son homogéneas (p=0,0642).

27
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Errores independientes

Probabilidad de que el error de una observación cualquiera tenga un


determinado valor, no debe depender de los valores de los otros
errores. De donde resulta, que los errores no son correlacionados. El
cumplimiento de esta suposición se garantiza, hasta cierto punto, por
la aleatorización de los tratamientos en las unidades experimentales y
mediante una buena técnica experimental (uso de borduras, evitar
contagio entre unidades experimentales, etc).
28
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Errores independientes

Para verificar el supuesto de errores independientes, se puede


realizar un gráfico de dispersión de los residuos en función de la
variable que se presume puede generar dependencias sobre las
observaciones.

Una tendencia a tener agrupados residuos positivos y/o negativos


indica la presencia de correlación o falta de independencia.

29
30
Figura 3: Gráfico de residuos en función de variable respuesta.
31
32
Una tendencia a tener agrupados residuos positivos
y/o negativos indica la presencia de correlación o falta
de independencia.

Figura 3: Gráfico de residuos en función de variable respuesta.


33
TRANSFORMACIÓN DE DATOS

La heterogeneidad de varianzas puede ocurrir debido a los


tratamientos evaluados, esto es, ciertos tratamientos presentan
mayor variabilidad que otros, sin que haya necesariamente una
relación entre la media y la varianza, o puede haber sido que si
exista esta relación.

En este caso, el procedimiento adoptado se refiere a la


transformación de los datos observados a otra escala, antes de
realizar el análisis de varianza.
34
ALGUNAS TRANSFORMACIONES COMÚNMENTE
UTILIZADAS
El proceso de obtención de la transformación de datos depende
del objetivo que se desea alcanzar con esa transformación.

Es sabido que difícilmente una transformación de datos irá atender


a todos los objetivos, aunque no sea raro, se busca homogeneidad
de varianzas y se consigue junto con ella una mejor aproximación
normal.

35
ALGUNAS TRANSFORMACIONES COMÚNMENTE
UTILIZADAS

• Raíz cuadrada

Es una transformación usualmente utilizada para datos con


varianzas que cambian proporcionalmente con la media,
frecuentemente cuando la variable observada Y se refiere a datos
de conteo de insectos u otros organismos, permitiendo suponer
que Y tiene distribución de Poisson.

36
ALGUNAS TRANSFORMACIONES COMÚNMENTE
UTILIZADAS
• Angular

Otro caso a considerar es el que trata de porcentajes p= (x/n) * 100,


relativas a n observaciones por parcela.

Los porcentajes deben estar basados en un denominador común


(por ejemplo, porcentaje de germinación calculado a partir de 50
semillas bajo distintos tratamientos)

37
ALGUNAS TRANSFORMACIONES COMÚNMENTE
UTILIZADAS
• Logarítmica

Cuando se verifica una proporcionalidad entre medias y desviaciones


estándar, se puede usar la transformación:

Macchiavelli (2003) indica que esta transformación se utiliza para


datos que exhiben efectos multiplicativos (una forma de falta de
aditividad) o cuando las varianzas son proporcionales al cuadrado de
las medias.
38
39
40
A partir de la variable
transformada
(LOG10_Rend.), se
prueban los supuestos
y posteriormente se
realiza el ANAVA y
prueba de
comparación de
medias (en caso que
se requiera).

41

También podría gustarte