Está en la página 1de 32

Unidad de Bioestadística

Facultad Experimental de ciencias y Tecnología


Departamento de Biología
Universidad de Carabobo. Valencia, Venezuela
Escuela Yenifer

Tarea Nº2: Análisis de Varianza y Kruskal Wallis

Respuesta Ejercicio Nº1

1. Contrastando con la prueba paramétrica (ANOVA)

a) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la producción y
la variable dependiente (o a explicar) que corresponde a las tres
variedades mejoradas genéticamente.
b) El factor es la productividad de cada variedad sembrada en las trece
parcelas, mientras que los niveles son las variedades sembradas, en este
experimento se tiene tres: Variedad 1, Variedad 2 y Variedad 3.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:

Ho: µ1=µ2=µ3; las medias de las tres variedades son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de la variedades es distinta.

Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

1. a’) Las K muestras representan muestras aleatorias independientes


extraídas de k poblaciones específicas.
2. b’) Cada una de las K poblaciones normal.
3. c’) Cada una de las K poblaciones tienen la misma varianza.
Para probar la normalidad de cada población se usa la prueba de Shapiro-
Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple, lo que hará


posible inferir el comportamiento de los datos de la población a partir de
los obtenidos de una muestra misma. Asimismo, el supuesto de
homogeneidad se cumple, lo que quiere decir que la variedad de las
poblaciones son iguales.

VARIEDAD 1 VARIEDAD 2 VARIEDAD 3

N 13 13 13

Shapiro-Wilk W 0,8797 0,945 0,9119

p(normal) 0,07066 0,5241 0,1949

Anderson-Darling A 0,5844 0,3218 0,4575

p(normal) 0,1031 0,4864 0,2208

p(Monte Carlo) 0,1008 0,5038 0,2266

Jarque-Bera JB 1,334 0,7779 0,6668

p(normal) 0,5132 0,6778 0,7165

p(Monte Carlo) 0,1844 0,4893 0,5762

Como podemos observar, con la prueba de Shapiro-Wilk se comprueba que


las poblaciones presentan un comportamiento normal, teniendo en cuenta que
el α=0.05.

Test for equal means

Sum of sqrs df Mean square F p (same)

Between groups: 3145,28 2 1572,64 13,96 3,252E-05


Within groups: 4055,69 36 112,658

Total: 7200,97 38

omega2: 0,3992

Levene´s test for homogeneity of variance, from means p (same): 0,6821

Levene´s test, from medians p (same): 0,7935

Welch F test in the case of unequal variances: F=11,81, df=23,67,


p=0,0002775

Por otro lado según el test de Levene se comprueba la homogeneidad de las


medias de cada población. Como observamos al aplicar el test de ANOVA se
tiene que la probabilidad de que las varianzas sean iguales es inferior a 0.05.

Por lo tanto se rechaza Ho, y se concluye que:

Existe suficiente evidencia para sustentar la aseveración de que las tres medias
poblacionales no son iguales.

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a que
el enfoque del investigador, en este caso es saber entre cuáles variedades hay
más diferencias y cuáles son más parecidas.

Por tanto se aplicará en este caso la prueba de Tukey, que corresponde a la


prueba porteriori de ANOVA:

Donde las hipótesis son las siguientes:

Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

En las hipótesis realizadas se observa que tanto las hipótesis nula y las
hipótesis alternativas se realizan por pareja, esto se debe a que este método se
basa en la creación de intervalos de confianza para todas las diferencias en
parejas entre las medias de los niveles de los factores mientras controla la tasa
de error por familia en un nivel especificado.

VARIEDAD 1 VARIEDAD 2 VARIEDAD 3

VARIEDAD 1 0,00886 0,1067

VARIEDAD 2 4,468 0,0001428

VARIEDAD 3 2,953 7,421

C’) Si las medias entre los grupos varían mucho y la media dentro del grupo
varia poco, es decir, los grupos son heterogéneos entre ellos y similares
internamente, el valor de F será más alto, y por tanto las variedades estarán
relacionadas, por lo que cuanto más difieren las medias de la variable
dependiente entre los grupos de la variable independiente, mas alto será el
valor de F.

Por lo tanto, podemos observar que las probabilidades resaltadas corresponden


a las variedades que difieren mucho entre si, en este caso la variedad 1 y 2, y
la variedad 2 y 3, mientas que las variedades 1 y 3 son las más parecidas. Esto
lo podemos observar gráficamente con la grafica de caja y bigote mostrada a
continuación:
Según el grafico, se puede apreciar que la línea media de la variedad 1 se
proyecta dentro del grafico de caja de la variedad 3, lo que quiere decir que la
media de estas variedades son parecidas, sin embargo se puede observar que
en las variedades 1 y 3 la línea media de estas se proyecta fuera de la caja de
la variedad 2 por lo que son distintas respecto a esta variedad.

2. Aplicando Kruskal-Wallis

La prueba de Kruskal-Wallis es una prueba no paramétrica que utiliza rangos


de datos muestrales de tres o más poblaciones independientes. Se utiliza para
probar la hipótesis nula de que las muestras independientes provienen de
poblaciones con medianas iguales; la hipótesis alternativa es la aseveración de
que las poblaciones tienen medianas que no son iguales, por tanto, las
hipótesis son las siguientes:

Ho=La productividad de las tres variedades es igual en cada parcela.

Hi: La productividad de las tres variedades es distinta.

Aplicando la prueba se tiene:

Kruskal-Wallis test for equal medians

H (chi2): 16,65

Hc (tie corrected): 16,68

p (same): 0,0002388

There is a significant difference between sample medians

Según lo observado, la probabilidad de que la producción de las tres


variedades sea igual es inferior a 0,05, por lo que se concluye con esta prueba
que la producción de las tres variedades es distinta.

Prueba de Mann-Whitney

Esta prueba Posteriori determina por parejas qué poblaciones tienen medianas
distintas:

VARIEDAD 1 VARIEDAD 2 VARIEDAD 3


VARIEDAD 1 0,006989 0,03091

VARIEDAD 2 0,006989 0,000324

VARIEDAD 3 0,03091 0,000324

Según lo observado, todas las poblaciones poseen medianas distintas.

Debido a que el test de Kruskal Wallis puede considerarse técnicamente como


una comparación de la media de los rangos, por lo tanto en termino de los
valores ordinales, el test de Kruskal-Wallis es mas general que una
comparación de medias realizada en el test de ANOVA, debido a que prueba
la probabilidad de que una observación aleatoria a partir de cada grupo tiene la
misma probabilidad de estar por encima o por debajo, de una observación
aleatoria a partir de otro grupo, por lo que la cantidad real de datos que
subyacen en esa comparación no se encuentra en la diferencia de las medias,
ni en la media de las diferencias, pero en realidad es la mediana de todos los
pares de las diferencias, la cantidad conocida como entre las muestras.

Por lo que se concluye con esto que los resultados obtenidos al aplicar las dos
pruebas (ANOVA y Kruskal-Wallis) son los siguientes:

 La prueba de ANOVA es mucho más fiable debido que a que utiliza


toda la información dada por los datos del experimento.
 La prueba de Kruskal-Wallis resulto menos eficiente debido que utiliza
la comparación de rangos, por lo que no se utiliza toda la información
proporcionada por el experimento.

f) En este caso se puede apreciar la grafica de residuales con respecto a las


variedades estudiadas, en efecto se puede observar que la variedad 1 y 2
poseen medias parecidas, mientas que la variedad 2 presenta una media
muy distinta con respecto a las variedades 1 y 3.
Respuesta Ejercicio Nº2

1. Contrastando con la prueba paramétrica (ANOVA)

c) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la existencia de
diferencias entre las edades de madures sexual y la variable
dependiente (o a explicar) que corresponde a las tres especies del
genero Daphnia.
d) El factor es la es la existencia de diferencias entre las edades de
madures sexual de las tres especies del género Daphnia, mientras que
los niveles son las especies correspondientes al género del crustáceo.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:

Ho: µ1=µ2=µ3; las medias de las tres especies son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de las especies es distinta.


Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

4. a’) Las K muestras representan muestras aleatorias independientes


extraídas de k poblaciones específicas.
5. b’) Cada una de las K poblaciones normal.
6. c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad no se cumple para las


especies 1 y 2, lo que imposibilitara inferir el comportamiento de los datos de
la población a partir de los obtenidos de una muestra misma. Por otro lado, el
supuesto de homogeneidad se cumple, lo que quiere decir que la variedad de
las poblaciones son iguales.

Sp1 Sp2 Sp3

N 5 5 5

Shapiro-Wilk W 0,6299 0,7369 0,9794

p(normal) 0,00152 0,02241 0,9312

Anderson-Darling A 0,9873 0,7041 0,1652

p(normal) 0,003455 0,02532 0,8734

p(Monte Carlo) 0,0014 0,0205 0,9428

Jarque-Bera JB 1,821 1,537 0,3268

p(normal) 0,4023 0,4637 0,8493

p(Monte Carlo) 0,0014 0,0176 0,8331

Test for equal means


Test for equal means

Como se puede apreciar en la grafica, los datos no siguen una distribucion


normal, por lo que si se aplica el test de ANOVA se corre el riesgo de obtener
resultados errados, debido a que el ANOVA al ser una prueba parametrica
tiene una gran efectividad muestras con un N grande, sin embargo, en este
caso se tienen muestras con un N pequeño, por lo que este caso es más
eficiente el uso de una prueba no paramétrica.

Como se aprecia en el test realizado de ANOVA, que las especies estudiadas


si presentan diferencias entre las edades de madurez sexual.

Test for equal means

Sum of sqrs df Mean square F p (same)

Between groups: 3,93733 2 1,96867 4,222 0,04091

Within groups: 5,596 12 0,466333

Total: 9,53333 14

omega2: 0,3005
Levene´s test for homogeneity of variance, from means p (same): 0,7021

Levene´s test, from medians p (same): 0,9428

Welch F test in the case of unequal variances: F=5,089, df=7,811, p=0,03846

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a
que el enfoque del investigador, en este caso es saber entre cuáles especies hay
más diferencias y cuáles son más parecidas.

Por tanto se aplicará en este caso la prueba de Tukey, que corresponde a la


prueba porteriori de ANOVA:

e) Donde las hipótesis son las siguientes:

Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

2. Aplicando Kruskal Wallis

Kruskal-Wallis test for equal medians

H (chi2): 8,015

Hc (tie corrected): 8,044

p (same): 0,01792

Como se aprecia, al aplicar la prueba de Kruskal-Wallis también se obtiene


que hay diferencias entre las medias de las especies, por lo que se rechaza la
hipótesis nula de que la media de las especies son iguales. En cuanto a la
prueba a posteriori a utilizar, se utilizó el test de Mann Whitney, en el que se
aprecia que hay diferencias significativas entre las medias de la especie 2 y 3,
siendo la 2 y la 1 parecidas, por lo que concluye en este caso que hay una
mayor diferencia de madurez sexual entre las edades de las especies 2 y 3, y
que hay similitudes de la madurez sexual entre las especies 1 y 2.

There is a significant difference between sample medians


Mann Whitney

Sp1 Sp2 Sp3

Sp1 0,1425 0,09369

Sp2 0,1425 0,01597

Sp3 0,09369 0,01597

En cuanto a la comparación de los resultados obtenidos en las dos pruebas,


resulta más eficiente, en este caso, la prueba de KruskaL-Wallis, debido a que
los datos muestrales no se distribuyen de manera normal

Grafico de cajas

En los graficos observados se aprecia lo antes supuesto.

Respuesta Ejercicio Nº3

1. Contrastando con la prueba paramétrica (ANOVA)

a) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la existencia de
4 subespecies de garrapatas y la variable dependiente (o a explicar) que
corresponde a las 4 cuatro localidades.
b) El factor es la es la existencia de 4 subespecies de garrapatas entre las
cuatro localidades donde se extrajeron los arácnidos.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:

Ho: µ1=µ2=µ3; las medias de las cuatro localidades son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de las cuatro localidades es


distinta.

Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

a’) Las K muestras representan muestras aleatorias independientes extraídas


de k poblaciones específicas.

b’) Cada una de las K poblaciones normal.

c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple para cada


localidad. Lo que hará posible inferir el comportamiento de los datos de la
población a partir de los obtenidos de una muestra misma. Por otro lado, el
supuesto de homogeneidad se cumple, lo que quiere decir que la variedad de
las poblaciones son iguales.

Localidad 1 localidad 2 localidad 3 localidad 4

N 8 10 13 6

Shapiro-Wilk W 0,83 0,9696 0,9725 0,8583

p(normal) 0,05934 0,8867 0,9226 0,1836


Anderson-Darling A 0,6418 0,1735 0,1779 0,4346

p(normal) 0,05883 0,8987 0,8985 0,1905

p(Monte Carlo) 0,0601 0,9335 0,9257 0,2026

Jarque-Bera JB 1,246 0,4909 0,5291 0,7947

p(normal) 0,5363 0,7824 0,7676 0,6721

p(Monte Carlo) 0,119 0,6862 0,6805 0,2307

Test for equal means

Sum of sqrs df Mean square F p (same)

Between groups: 6084,42 3 2028,14 16,61 9,442E-07

Within groups: 4030,5 33 122,136

Total: 10114,9 36

omega2: 0,5586

Levene´s test for homogeneity of variance, from means p (same): 0,3724

Levene´s test, from medians p (same): 0,7907

Welch F test in the case of unequal variances: F=10,76, df=15,04,


p=0,0004963

Como se aprecia en la prueba de ANOVA, las probabilidad de que las medias


sean iguales es inferior al α=0.05, por lo que se rechaza la hipótesis nula que
establece que las medias de las cuatro localidades son iguales.
En las graficas observadas se aprecia la normalidad de los datos muestrales, y
la agrupación de las localidades de acuerdo a su semejanza.

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a
que el enfoque del investigador, en este caso es saber entre cuáles localidades
hay mas diferencia .Por tanto se aplicará en este caso la prueba de Tukey, que
corresponde a la prueba porteriori de ANOVA:

f) Donde las hipótesis son las siguientes:

Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

Localidad 1 localidad 2 localidad 3 localidad 4

Localidad 1 0,0001677 0,0001712 0,0001685

localidad 2 8,354 0,9983 1

localidad 3 8,114 0,24 0,9994

localidad 4 8,284 0,0705 0,1695

Según lo observado, la localidad 1 difiere de las localidades 2, 3 y 4, mientras


que estas tres últimas son más parecidas, incluso se aprecia que la localidad 3
y 4 son iguales.

2. Aplicando Krusklal-Wallis

Kruskal-Wallis test for equal medians


H (chi2): 14,91

Hc (tie corrected): 14,96

p (same): 0,001854

There is a significant difference between sample medians

Al igual que en el test de ANOVA, este método también rechaza la hipótesis


nula planteada, por lo que se concluye de que al menos una de las medias de
las localidades es distinta, en este caso la de la localidad 1. Por otra parte, la
prueba posteriori planteada es la prueba de Mann Whitney. A continuación se
aprecian los resultados:

Localidad 1 localidad 2 localidad 3 localidad 4

Localidad 1 0,001591 0,0007434 0,006586

localidad 2 0,001591 0,7798 0,9566

localidad 3 0,0007434 0,7798 1

localidad 4 0,006586 0,9566 1

En eta prueba se corrabora lo anterior.

En cuanto a la comparación de las dos pruebas realizadas se observo que se


obtuvo los mismos resultados, por lo que ambas pruebas resultaron eficientes
en este caso.
Mediante estos graficos se demuestran los resultados obtenidos.

Respuesta Ejercicio Nº4

1. Contrastando con la prueba paramétrica (ANOVA)

c) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la preferencia
de la plaga y la variable dependiente (o a explicar) que corresponde a
los 4 cuatro cultivos.
d) El factor es la preferencia de la plaga a los cutro cultivos de arroz,
cebada, trigo y maíz.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:
Ho: µ1=µ2=µ3; las medias de los cuatro cultivos son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de los cuatro cultivos es distinta.

Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

a’) Las K muestras representan muestras aleatorias independientes extraídas


de k poblaciones específicas.

b’) Cada una de las K poblaciones normal.

c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple para cada


localidad. Lo que hará posible inferir el comportamiento de los datos de la
población a partir de los obtenidos de una muestra misma. Por otro lado, el
supuesto de homogeneidad se cumple, lo que quiere decir que la variedad de
las poblaciones son iguales

Maiz Arroz Trigo Cebada

N 6 6 6 6

Shapiro-Wilk W 0,9536 0,9802 0,9774 0,9808

p(normal) 0,7695 0,9525 0,9379 0,9554

Anderson-Darling A 0,2244 0,1696 0,154 0,1472

p(normal) 0,6895 0,8812 0,9112 0,9252

p(Monte Carlo) 0,7708 0,9389 0,9672 0,9774

Jarque-Bera JB 0,4908 0,2098 0,3787 0,3907

p(normal) 0,7824 0,9004 0,8275 0,8225

p(Monte Carlo) 0,619 0,9225 0,7642 0,7464


Test for equal means

Según los resultados de la prueba de ANOVA, la probabilidad de que las


medias de los cuatro cultivos sean iguales es inferior a 0,05, por lo que se
rechaza la hipótesis nula que establece que las medias de los cuatro cultivos
son iguales.

Sum of sqrs df Mean square F p (same)

Between groups: 797,458 3 265,819 19,51 3,724E-06

Within groups: 272,5 20 13,625

Total: 1069,96 23

omega2: 0,6982

Levene´s test for homogeneity of variance, from means p (same): 0,9986

Levene´s test, from medians p (same): 0,9987

Welch F test in the case of unequal variances: F=16,82, df=11,09,


p=0,0001947

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a
que el enfoque del investigador, en este caso es saber cuales on los cultivos
nas atacados por la plaga.Por tanto se aplicará en este caso la prueba de
Tukey, que corresponde a la prueba porteriori de ANOVA:
a) Donde las hipótesis son las siguientes:

Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

Maiz Arroz Trigo Cebada

Maiz 0,000662 0,3397 0,3031

Arroz 6,857 0,0001821 0,0001809

Trigo 2,433 9,29 0,9998

Cebada2,5449,4010,1106

Según los resultados de la prueba, se tiene que los cultivos de maíz, trigo y
cebada poseen medias parecidas, siendo las de trigo y cebada prácticamente
iguales, mientras que la media del cultivo de arroz es la más distinta, por lo
que se concluye en este caso que la plaga tiene preferencia hacia los cultivos
de arroz con respecto a los otros cultivos.

2. Aplicando Kruskal-Wallis test for equal medians

H (chi2): 14,43

Hc (tie corrected): 14,49

p (same): 0,002311

There is a significant difference between sample medians

En estas pruebas aplicadas se aprecian las misma conclusiones realizadas con


la prueba anterior.

Maiz Arroz Trigo Cebada

Maiz 0,008239 0,172 0,1255

Arroz 0,008239 0,005075 0,005075

Trigo 0,172 0,005075 1


Cebada 0,1255 0,005075 1

Respuesta Ejercicio Nº5

1. Contrastando con la prueba paramétrica (ANOVA)

e) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la longitud de
la raíz de guisantes y la variable dependiente (o a explicar) que
corresponde a la adición de los distintos tipos de azucares en presencia
de auxina.
f) El factor es la longitud de la raíz respecto a la adición de los distintos
tipos de azucares en presencia de auxina.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:
Ho: µ1=µ2=µ3; las medias de los cuatro cultivos son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de los cuatro cultivos es distinta.

Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

a’) Las K muestras representan muestras aleatorias independientes extraídas


de k poblaciones específicas.

b’) Cada una de las K poblaciones normal.

c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple para cada


localidad. Lo que hará posible inferir el comportamiento de los datos de la
población a partir de los obtenidos de una muestra misma. Por otro lado, el
supuesto de homogeneidad no se cumple, lo que quiere decir que la variedad
de las poblaciones no es igual.

Control Glucosa 2% Fructosa 2%G+F 1% Sacarosa 2%

N 10 10 10 10 10

Shapiro-Wilk W 0,8823 0,9465 0,882 0,9239 0,9047

p(normal) 0,1388 0,6272 0,1375 0,3906 0,2463

Anderson-Darling A 0,5445 0,2714 0,4961 0,4044


0,4165

p(normal) 0,1186 0,5887 0,1618 0,2855 0,2653

p(Monte Carlo) 0,1223 0,6466 0,1698 0,2982 0,2803

Jarque-Bera JB 1,029 0,3505 0,883 0,9351 0,6717


p(normal) 0,5979 0,8393 0,6431 0,6265 0,7147

p(Monte Carlo) 0,2379 0,8089 0,3417 0,304 0,52

Levene´s test for homogeneity of variance, from means p (same):


0,0006548

Levene´s test, from medians p (same): 0,003468

Welch F test in the case of unequal variances: F=33,83, df=22,2, p=3,77E-09

Según los resultados de la prueba de ANOVA, la probabilidad de que las


medias de los cuatro cultivos sean iguales es inferior a 0,05, por lo que se
rechaza la hipótesis nula que establece que las medias son iguales.

En este caso, no es necesario de una aplicación de las pruebas a posteriori,


debido a que la probabilidad de que las muestras sean iguales es pequeña y el
investigador no desea saber cual es más distinta o parecida con respecto a las
demás.
Sin embargo, la grafica de residuals con respect al error, nos da una idea
aproximada de aqguellos grupos con medias similares, y aquellos con medias
mas distintas.

2. Aplicando Kruskal-Wallis

H (chi2): 38,11

Hc (tie corrected): 38,44

p (same): 9,105E-08

There is a significant difference between sample medians

Como se aprecia, al aplicar el test de Kruskal-Wallis se obtiene el


mismo resultado, por lo que se concluye de forma definitiva que la media de
las musetras son distintas.

Respuesta Ejercicio Nº6

1. Contrastando con la prueba paramétrica (ANOVA)


a) El modelo de ANOVA aplicado en este caso corresponde al de una vía,
es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es la longitud de
la raíz de guisantes y la variable dependiente (o a explicar) que
corresponde a la adición de los distintos tipos de azucares en presencia
de auxina.
b) El factor es la longitud de la raíz respecto a la adición de los distintos
tipos de azucares en presencia de auxina.

a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y


alternativa:

Ho: µ1=µ2=µ3; las medias de los cuatro cultivos son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de los cuatro cultivos es distinta.

Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

a’) Las K muestras representan muestras aleatorias independientes extraídas


de k poblaciones específicas.

b’) Cada una de las K poblaciones normal.

c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple para los meses


Febrero, Abril y Septiembre, mientras que para los meses Junio y Noviembre
el supuesto no se cumple. Por otro lado, el supuesto de homogeneidad se
cumple, lo que quiere decir que la variedad de las poblaciones es igual.

Febrero Abril Junio Septiembre Noviembre

N 20 20 20 20 20
Shapiro-Wilk W 0,9404 0,9401 0,8729 0,9693 0,881

p(normal) 0,2435 0,2409 0,01322 0,7392 0,01844

Anderson-Darling A 0,4169 0,4643 0,8652 0,262 0,9166

p(normal) 0,3 0,228 0,02142 0,6668 0,01579

p(Monte Carlo) 0,3071 0,2294 0,0219 0,6926 0,0176

Jarque-Bera JB 1,696 1,049 9,074 0,9436 2,21

p(normal) 0,4283 0,5918 0,01071 0,6239 0,3311

p(Monte Carlo) 0,1718 0,3996 0,0113 0,4502 0,1133

Test for equal means

Sum of sqrs df Mean square F p (same)

Between groups: 1,9734 4 0,49335 1,977 0,1043

Within groups: 23,7085 95 0,249563

Total: 25,6819 99

omega2: 0,0376

Levene´s test for homogeneity of variance, from means p (same): 0,7151

Levene´s test, from medians p (same): 0,7744

Welch F test in the case of unequal variances: F=1,849, df=47,37, p=0,1352

Como se puede apreciar según el estadístico de ANOVA acepta la hipótesis


nula, que establece que la media de las poblaciones son iguales.
Como se aprecia en los siguientes gráficos, a pesar que los datos tomados del
mes de Junio no se distribuyen normalmente, podemos apreciar como los
datos del experimento tienen una tendencia normal, a pesar de observarse
algunas desviaciones en los extremos. Por otra parte también se puede apreciar
en la otra grafica la similitud de las medias de cada población.

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a
que el enfoque del investigador, en este caso es saber cuáles son los meses en
los que se presenta una mayor variación. Por tanto se aplicará en este caso la
prueba de Tukey, que corresponde a la prueba posteriori de ANOVA:

a) Donde las hipótesis son las siguientes:

Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

Prueba de Tukey

Febrero Abril Junio Septiembre Noviembre

Febrero 0,161 0,9999 0,9126 0,7126

Abril 3,223 0,1145 0,6137 0,849

Junio 0,2238 3,447 0,849 0,6137

Septiembre 1,209 2,014 1,432 0,9939


Noviembre 1,79 1,432 2,014 0,5819

Según los resultados observados al aplicar la prueba, se aprecia que todos los
mese poseen similitudes, sin embargo se puede apreciar como el mes de Abril
es el más distinto con respecto a los demás meses, por lo que se evidencia una
mayor longitud del pico de las palomas en ese mes.

2. Aplicando Krsukal-Wallis

Kruskal-Wallis test for equal medians

H (chi2): 7,302

Hc (tie corrected): 7,341

p (same): 0,1189

There is no significant difference between sample medians

Aplicando este tests podemos corraborar el resultado anterior, por lo


que se acepta la hipótesis nula que establece que las medias de las poblaciones
son iguales.

Test de Mann-Whitney

Febrero Abril Junio Septiembre Noviembre

Febrero 0,1092 0,4078 0,6741 0,5059

Abril 0,1092 0,01629 0,1665 0,3082

Junio 0,4078 0,01629 0,2266 0,05887

Septiembre 0,6741 0,1665 0,2266 0,5779

Noviembre 0,5059 0,3082 0,05887 0,5779

En este test se aprecia las similitudes anteriormente habladas, sin embargo


también se observa que si bien son similares, la similitud entre las poblaciones
es inferior a las observadas en el test de Tukey, sin embargo, debido que la
prueba utilizada a continuación es una prueba no paramétrica cuya eficacia es
inferior respecto a las pruebas paramétricas realizadas anteriormente, se puede
concluir entonces que los resultados obtenidos en la prueba de ANOVA son
más fiables que los realizados en el test de Kruskal-Wallis.

En los siguientes gráficos se aprecia lo antes mencionado, que las medias de


cada población son iguales y que el mes que presenta una mayor longitud en el
pico de las palomas es Abril.

Respuesta Ejercicio Nº8

1. Contrastando con la prueba paramétrica (ANOVA)

a) El modelo de ANOVA aplicado en este caso corresponde al de una vía,


es decir, a que solamente se está estudiando un factor en el
experimento, la variable independiente, que este caso es el peso de los
pollos de seis mese de edad y la variable dependiente (o a explicar) que
corresponde a las cuatro granjas.
b) El factor es el peso de los pollos provenientes de las distintas granjas
avícolas.
a’) Primero, para aplicar la prueba contrastamos la hipótesis nula y
alternativa:

Ho: µ1=µ2=µ3; las medias de las cuatro granjas son iguales

Hi: µ1≠µ2≠µ3; al menos una de las medias de los cuatro granjas es distinta.
Luego debemos probar que los datos de los experimentos cumplen los
siguientes supuestos:

a’) Las K muestras representan muestras aleatorias independientes extraídas


de k poblaciones específicas.

b’) Cada una de las K poblaciones normal.

c’) Cada una de las K poblaciones tienen la misma varianza.

Para probar la normalidad de cada población se usa la prueba de Shapiro-


Wilk, mientras que para probar la homogeneidad de las varianzas usaremos
la prueba de Levene.

Como podemos apreciar, el supuesto de normalidad se cumple. Por otro lado,


el supuesto de homogeneidad también se cumple, lo que quiere decir que la
variedad de las poblaciones es igual.

A B C D

N 15 15 15 15

Shapiro-Wilk W 0,9562 0,8966 0,9529 0,9729

p(normal) 0,6274 0,08459 0,571 0,8985

Anderson-Darling A 0,3084 0,6642 0,2862 0,2003

p(normal) 0,5196 0,06609 0,5732 0,8553

p(Monte Carlo) 0,5379 0,0666 0,6149 0,8602

Jarque-Bera JB 0,7335 2,221 0,9102 0,4215

p(normal) 0,693 0,3294 0,6344 0,81

p(Monte Carlo) 0,5421 0,0879 0,4209 0,764


Ahora bien, al aplicar el test de ANOVA se aprecia que la probabilidad de que
las medias de cada población sean iguales es inferior a 0.05, lo lo que se
rechaza la hipótesis nula que establece que la media del peso de los pollos
provenientes de las cuatro granjas son iguales. Sin embrago, a pesar de que la
probabilidad de rechazo no es tan pequeña, es necesario aplicar las pruebas a
posteriori, para así obtener información acerca de cuál es la población que
presenta mas varianza.

Test for equal means

Sum of sqrs df Mean square F p (same)

Between groups: 3,09261 3 1,03087 3,327 0,02596

Within groups: 17,3512 56 0,309843

Total: 20,4438 59

omega2: 0,1042

Levene´s test for homogeneity of variance, from means p (same): 0,5464

Levene´s test, from medians p (same): 0,4408

Welch F test in the case of unequal variances: F=3,036, df=30,74, p=0,04396

b’) y d). En este caso es necesario aplicar las pruebas a posteriori debido a
que el enfoque del investigador, en este caso es saber cuáles son los meses en
los que se presenta una mayor variación. Por tanto se aplicará en este caso la
prueba de Tukey, que corresponde a la prueba posteriori de ANOVA:

a) Donde las hipótesis son las siguientes:


Ho: µ1=µ2 Ho: µ1=µ3 Ho: µ2=µ1 Ho: µ2=µ3 Ho: µ3=µ1 Ho: µ3=µ2

Hi: µ1≠µ2 Hi: µ1≠µ3 Hi: µ2≠µ1 Hi: µ2≠µ3 Hi: µ3≠µ1 Hi: µ3≠µ2

Prueba de Tukey

A B C D

A 0,2703 0,01473 0,5348

B 2,588 0,5717 0,9635

C 4,416 1,828 0,2979

D 1,911 0,6772 2,505

Como se aprecia, según esta prueba la granja C, presenta una varianza


marcada con respecto a las demás, siendo esta inferior con respecto a las otras
granjas.

3. Aplicando Kruskal-Wallis

test for equal medians

H (chi2): 9,266

Hc (tie corrected): 9,268

p (same): 0,02593

There is a significant difference between sample medians

A B C D

A 0,03096 0,006585 0,29

B 0,03096 0,1646 0,4552

C 0,006585 0,1646 0,1149

D 0,29 0,4552 0,1149

También podría gustarte