Tema 3 Supuestos Del Anava

Universidad de la Amazonia
Facultad de Ingeniería
Programa Ingeniería Agroecológica
SUPUESTOS DEL ANALISIS DE

VARIANZA
DIANA MARÍA SÁNCHEZ OLAYA

INGENIERA AGROECÓLOGA
MG. EN AGROFORESTERÍA
SUPUESTOS DEL ANAVA
Los supuestos del ANAVA implican:

- Errores independientes,
- Normalmente distribuidos y con
- Varianzas homogéneas para todas las observaciones.
2
SUPUESTOS DEL ANAVA
La verificación de los supuestos se realiza en la práctica a través
de los predictores de los términos de error aleatorio que son
los residuos aleatorios asociados a cada observación.
El residuo asociado a la observación ij-

ésima (simbolizado como eij) es la
diferencia entre el valor observado y
el valor predicho por el modelo para
la respuesta en la unidad
experimental ij-ésima
3
SUPUESTOS DEL ANAVA
Por lo general, en la práctica, los supuestos del ANAVA no se

cumplen con exactitud. En caso de que haya evidencia de faltas
graves de cumplimiento de los supuestos, el modelo y/o la
estrategia de análisis podría no ser adecuado.
4
Se realizó un experimento donde se evaluaron cuatro híbridos de maíz sobre el
rendimiento en kg/ha. Para ello se utilizaron 10 repeticiones por cada híbrido. La unidad
experimental consistió en parcelas de terreno de 5m de ancho por 5m de largo.
5
6
7
La variable
dependiente es la
variable que se desea
examinar (variable
respuesta)
8
Las variables de
clasificación son las
variables que
representan factores o
fuentes de
variación que permiten
separar o clasificar las
observaciones del
archivo en grupos.
9
10
11
12
VERIFICACIÓN DE SUPUESTOS DEL ANAVA
- Normalidad
Seleccionando los residuos como variable de análisis, una de las

técnicas más usadas es construir un Q-Q plot normal. Mediante
esta técnica se obtiene un diagrama de dispersión de los
residuos obtenidos versus los cuantiles teóricos de una
distribución normal. Si los residuos son normales y no hay otros
defectos del modelo, se alinearán sobre una recta a 45°.
13
14
Si los residuos son normales
y no hay otros defectos del
modelo, se alinearán sobre
una recta a 45°.
Figura 1: Q-Q plot (normal) obtenido a partir de un modelo con errores normales.
15
- Normalidad
Otra opción es realizar una prueba de hipótesis sobre

normalidad, seleccionando los residuos como variable de
análisis se obtiene el estadístico W* de Shapiro-Wilks.
Las hipótesis que se someten a prueba son:

Ho: los residuos tienen distribución normal versus
Ha: los residuos no tienen distribución normal.
16
17
p(Unilateral D)>0,05:
Ho: los residuos tienen distribución normal.
p(Unilateral D)<0,05:
Ha: los residuos no tienen distribución normal.
En este caso no hay evidencias para rechazar el supuesto de

distribución normal (p=0,2975).
18
- Homogeneidad de varianzas
Cuando los errores son homocedásticos, haciendo un gráfico de

dispersión de residuos versus valores predichos se debe observar
una nube de puntos sin patrón alguno (patrón aleatorio).
Si el gráfico muestra estructura habrá indicios para sospechar

sobre el cumplimiento del supuesto.
19
20
Se debe observar una nube de puntos
sin patrón alguno (patrón aleatorio).
Figura 2: Gráfico de residuos en función de predichos.

21
Patrones de comportamiento de la gráfica residuos vs. predichos
22
Patrones de comportamiento de la gráfica residuos vs. predichos
23
Otra estrategia para la validación del supuesto de

homocedasticidad para el factor tratamientos, es la prueba de
Levene.
La prueba consiste en realizar un análisis de la varianza usando

como variable dependiente el valor absoluto de los residuos. Este
análisis se debe realizar con un modelo a una vía de clasificación.
24
Las hipótesis que se someten a prueba son:

Ho: todas las varianzas son homogéneas versus
Ha: al menos dos varianzas son distintas.
Si el valor p del factor tratamiento de este ANAVA es menor al

valor de significación nominal se rechaza la hipótesis de varianzas
homogéneas, caso contrario el supuesto de igualdad de varianzas
puede ser sostenido.
25
26
p-valor tratamiento > 0,05: Ho: todas las varianzas son homogéneas
p-valor tratamiento < 0,05: Ha: al menos dos varianzas son distintas
En este caso las varianzas son homogéneas (p=0,0642).
27
- Errores independientes
Probabilidad de que el error de una observación cualquiera tenga un

determinado valor, no debe depender de los valores de los otros
errores. De donde resulta, que los errores no son correlacionados. El
cumplimiento de esta suposición se garantiza, hasta cierto punto, por
la aleatorización de los tratamientos en las unidades experimentales y
mediante una buena técnica experimental (uso de borduras, evitar
contagio entre unidades experimentales, etc).
28
- Errores independientes
Para verificar el supuesto de errores independientes, se puede

realizar un gráfico de dispersión de los residuos en función de la
variable que se presume puede generar dependencias sobre las
observaciones.
Una tendencia a tener agrupados residuos positivos y/o negativos

indica la presencia de correlación o falta de independencia.
29
30
Figura 3: Gráfico de residuos en función de variable respuesta.
31
32
Una tendencia a tener agrupados residuos positivos
y/o negativos indica la presencia de correlación o falta
de independencia.
Figura 3: Gráfico de residuos en función de variable respuesta.

33
TRANSFORMACIÓN DE DATOS
La heterogeneidad de varianzas puede ocurrir debido a los

tratamientos evaluados, esto es, ciertos tratamientos presentan
mayor variabilidad que otros, sin que haya necesariamente una
relación entre la media y la varianza, o puede haber sido que si
exista esta relación.
En este caso, el procedimiento adoptado se refiere a la

transformación de los datos observados a otra escala, antes de
realizar el análisis de varianza.
34
ALGUNAS TRANSFORMACIONES COMÚNMENTE
UTILIZADAS
El proceso de obtención de la transformación de datos depende
del objetivo que se desea alcanzar con esa transformación.
Es sabido que difícilmente una transformación de datos irá atender

a todos los objetivos, aunque no sea raro, se busca homogeneidad
de varianzas y se consigue junto con ella una mejor aproximación
normal.
35
UTILIZADAS
• Raíz cuadrada
Es una transformación usualmente utilizada para datos con

varianzas que cambian proporcionalmente con la media,
frecuentemente cuando la variable observada Y se refiere a datos
de conteo de insectos u otros organismos, permitiendo suponer
que Y tiene distribución de Poisson.
36
UTILIZADAS
• Angular
Otro caso a considerar es el que trata de porcentajes p= (x/n) * 100,

relativas a n observaciones por parcela.
Los porcentajes deben estar basados en un denominador común

(por ejemplo, porcentaje de germinación calculado a partir de 50
semillas bajo distintos tratamientos)
37
UTILIZADAS
• Logarítmica
Cuando se verifica una proporcionalidad entre medias y desviaciones

estándar, se puede usar la transformación:
Macchiavelli (2003) indica que esta transformación se utiliza para

datos que exhiben efectos multiplicativos (una forma de falta de
aditividad) o cuando las varianzas son proporcionales al cuadrado de
las medias.
38
39
40
A partir de la variable
transformada
(LOG10_Rend.), se
prueban los supuestos
y posteriormente se
realiza el ANAVA y
prueba de
comparación de
medias (en caso que
se requiera).
41

Tema 3 Supuestos Del Anava

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Tema 3 Supuestos Del Anava

Cargado por

Copyright:

Formatos disponibles

Universidad de la Amazonia

SUPUESTOS DEL ANALISIS DE

DIANA MARÍA SÁNCHEZ OLAYA

Los supuestos del ANAVA implican:

El residuo asociado a la observación ij-

Por lo general, en la práctica, los supuestos del ANAVA no se

Seleccionando los residuos como variable de análisis, una de las

Otra opción es realizar una prueba de hipótesis sobre

Las hipótesis que se someten a prueba son:

En este caso no hay evidencias para rechazar el supuesto de

Cuando los errores son homocedásticos, haciendo un gráfico de

Si el gráfico muestra estructura habrá indicios para sospechar

Figura 2: Gráfico de residuos en función de predichos.

Otra estrategia para la validación del supuesto de

La prueba consiste en realizar un análisis de la varianza usando

Las hipótesis que se someten a prueba son:

Si el valor p del factor tratamiento de este ANAVA es menor al

Probabilidad de que el error de una observación cualquiera tenga un

Para verificar el supuesto de errores independientes, se puede

Una tendencia a tener agrupados residuos positivos y/o negativos

Figura 3: Gráfico de residuos en función de variable respuesta.

La heterogeneidad de varianzas puede ocurrir debido a los

En este caso, el procedimiento adoptado se refiere a la

Es sabido que difícilmente una transformación de datos irá atender

Es una transformación usualmente utilizada para datos con

Otro caso a considerar es el que trata de porcentajes p= (x/n) * 100,

Los porcentajes deben estar basados en un denominador común

Cuando se verifica una proporcionalidad entre medias y desviaciones

Macchiavelli (2003) indica que esta transformación se utiliza para

También podría gustarte