Está en la página 1de 8

ANOVA

La variable dependiente en a nova es cuantitativa y la independiente es cualitativa la cual recibe el


nombre de factor que se clasifica en categorías de modelos o tratamiento

MODELO

MODELOS DE LAS MEDIAS

Yij=µi + Eij, i=1,.,a, j=1,…,m

HIPOTESIS DE INTERES

H 0 : μ1=μ 2=¿ μa
H 1: μi ≠ μj , ¥ i ± ji=1 , … , a y j=1 , … , a
MODELOS DE LOS TRATAMIENTOS

Yij=μ+Yi +εij , i=1 ,2 , … , a , j=1 , … , m


HIPOTESIS DE INTERES

H 0 :Y 1=Y 2=Ya=0
H 1:Yi ≠ 0 , ¥ i=1 ,2 , … , a
Ojo: el Y que pongo en realidad es tau por ende el Yi= es el i-esimo termino(niveles del factor)

¿CUALES SON LOS SUPUESTOS DEL MODELO ANOVA?

1) εij N (ϑ , σ 2 )
2) Cov ( εij , εik )=0

Las diferencias entre efectos fijos y efectos aleatorios, es que solo es un análisis descriptivo de ese
tratamiento y solo sirven para ese tratamiento, mientras que en los efectos aleatorios es más
global
DESCOMPOSICION DE LA SUMA DE CUADRADOS TOTAL

El anova tradicional parte de descomponer la variación total de la muestra en dos componentes

Variacion total=

Si mi resultado está en RR, quiere decir que mi modelo no sirve, caso contrario si queda RA

EJEMPLO DE LA GUIA

En este caso, se tiene que la variable respuesta (dependiente) corresponde a la altura, en cms, de
los eucaliptos globulus y la variable independiente p factor es la fertilización, que tiene tres
tratamientos o niveles:

Tau1=0 gramo por planta testigo

Tau2=60 gramos por planta

Tau3=120 gramos por planta

Se desea determinar si la altura promedio de los eucaliptos globulus depende del tipo de
tratamientos por lo que se trata un Modelo anova de un factor

H0= el tipo de tratamiento no afecta el crecimiento de los arboles (H0:Y1=Y2=Y3=0)


H1= el tipo de tratamiento afecta el crecimiento de los arboles H1:Y≠0 ¥ i=1,2,3

IMPORTANTE CLASE 18/10

A la izquierda de la colita de chancho va la variable dependiente y a la derecha la variable


independiente (y~x)

Modelo:

Yij= μi+ ε + S i=1 , 2, 3

Yij= μi+ Yi+ εij

¿Que es str(df)?, determina el tipo de clase

De la tabla anova, el p-value es 1,17*10^-05 < α =0.05, por lo tanto, considerando un nivel de
significancia del 5% podemos concluir que la altura de los eucaliptos dependen del fertilizante

H 1: μi ≠ μj=¿ μi−μj ≠ 0
¿> μ 1−μ 2 ≠ 0
¿> μ 1−μ 3 ≠ 0
¿> μ 2−μ 3 ≠ 0
TASA DE ERROR

1-(1-α)^K

K=

α=P(Error tipo 1)=P(Rechazar H0/H0 es verdadero)


Prueba post noc

1.- H 0 : μi=μj

2.- H 1: μi ≠ μj

¿Cuál es el tratamiento que produce que las alturas de los eucaliptos sean mayor o menor?

Entonces lo que busco es un test de diferencia de media

Ojo=una prueba post oc debe hacerse cuando se rechaza H0, porque uno dice bueno el modelo
anova no es basura, entonces yo quiero saber cuáles son los tratamientos que me hacen que las
alturas sean diferentes y lo que hace el post oc es decirme cual es la combinación de
tratamientos que me hace que las alturas sean diferentes
Yij= μi+ εij , este es mi modelo y si sirve

¿Las alturas promedias de los Eucalyptos son iguales en los tratamientos 1 y 2?

1.- H 0 : μ1=μ 2 0 € IC ( μ 1−μ 2 ¿

2.- H 1: μ 1 ≠ μ 2

¿las alturas de los tratamientos son iguales en los tratamientos 1 y 3?

1.- H 0 : μ 2=μ 3

2.- H 1: μ 2 ≠ μ 3

¿Las alturas promedias de los Eucalyptos son iguales en los tratamientos 2 y 2?

1.- H 0 : μ1=μ 3

2.- H 1: μ 1 ≠ μ 3
Solo me interesa el 1-3 y 2-3…….lo que yo busco es los intervalos de confianza que no contienen el
cero

CASO UNO

H0: μ 1=μ 2 o H1: μ 1≠ μ 2 nos da que el p-value es 0.94104> 5% entonces las medias de los
tratamientos 1 y 2 no es significativa (entonces esa hipótesis no sirve)
CASO DOS

Como p-value=0.00052<5%, entonces existen diferencias significativas en las alturas de los


eucaliptos al considerar el tratamiento 3 y 1. De acuerdo al I.c. para µ3-µ1 se tiene que:

µ3-µ1<0  µ3<µ1=> con una confianza del 95%, podemos concluir que las alturas promedios de
los eucaliptos son ,ayores cuando se utiliza el fertilizante uno

CASO TRES

Como p-valor=1.8*10^-5<5%, podemos concluir con una significancia del 5% que hay diferencias
significativas entre las alturas promedios de los eucaliptos al utilizar fwrtilizante 2 y 3. Como µ3-
µ2<0 µ3<µ2, es decir, las alturaspromedio de los eucaliptos usando el fertilizante 2 es mayor
que con las alturas de los eucaliptos considerando el fertilizante 3

AHORA QUEDO MUY BONITO EL MODELO Y TODO LO QUE SE QUIERA, PERO SI NO


COMPRUEBO LOS SUPUESTOS, DA LO MISMO PORQUE NO SACARIA BUENAS
CONCLUSIONES

Yij= μi+ εij

εij ~N(ϑ , σ 2 )
RESIDUOS (eij=Yij−Ýij ¿

SUPUESTOS
1) Normalidad de los residuos
H0: eij están distribuidos normalmente
H1: eij no están distribuidos normalmente
2) Homocedasticidad
H0:( σ 1 )2= ( σ 2 )2=¿ ( σn )2
H1:( σi )2 ≠ ( σj )2

RESIDUOS= distancia entre lo observado y lo estimado


AHORA DEBEMOS COMPROBAR LA NORMALIDAD

Como p-value=0.2732>5% no se rechaza H0, es decir están distribuidos normalmente

AHORA DEBEMOS COMPROBAR LA HOMOCEDASTICIDAD

Como el p-value es mayor que el 5% no se rechaza H0

¿Qué porcentaje de la variabilidad de la altura de los eucaliptos se puede explicar a través


de la variabilidad de los tratamientos ¿

Medida de bondad de ajuste-> tamaños del efecto

AHORA VEMOS EL TAMAÑO DE LA ASOCIACION EXISTENTE

También podría gustarte