Está en la página 1de 21

Universidad de Panamá

Facultad de Ciencias Agropecuarias

Escuela de Ingeniería Agrícola

Maestría: En Ciencias Agrícolas con énfasis en Conservación de Suelos y Aguas

Asignatura:

Diseños Experimentales

Asignación #4

Grupo #1

Estudiantes:

Josshua Joel Jaramillo López, (8-782-2133)

Aldy Mariscal , (8-889-1345)

Kathia Mojica, (9-713-1784)

Yonelis Vásquez, (2-735-736)


Preguntas de investigación…
1. Investigue la aplicación de las pruebas chi cuadrado en el campo de las
ciencias agropecuarias.
La prueba Chi Cuadrado χ², según Montgomery (2004), su fundamentación teórica y los casos
más frecuentes de aplicación son en gran parte de acuerdo a la metodología empírica, en la
investigación de las ciencias agronómicas y un sin número de disciplinas que se valen de esta
poderosa herramienta.

En la agronomía esta prueba se utiliza para estudiar el comportamiento de los cultivos .

No obstante el uso correcto de la prueba Chi Cuadrado χ² en cualquier estudio requiere que el
investigador tenga en cuenta:
1. El uso del conocimiento no estadístico de problema, que apoye la pertinencia de usar o
no esta técnica y elegir los factores susceptibles de ser comparados o relacionados e
interpretar los resultados que puedan arrojar las prueba Chi Cuadrado, que se utilicen.
2. Mantener el diseño de la investigación y el análisis tan simple como sea posible, es
necesario no exagerar en el uso de técnicas estadísticas complejas y sofisticadas cuando
existen métodos más sencillos y comprensibles para cumplir el mismo objetivo. Los métodos
y análisis relativamente simples son siempre mejores
3. Tener presente la diferencia entre significación práctica y significación estadística.
Esto se debe a que dos condiciones experimentales producen respuestas medias que son
estadísticamente diferentes, no existe ninguna seguridad de que esta diferencia sea de la
magnitud suficiente como para tener algún valor práctico.
Problema No. 1
En un laboratorio se observó el número de partículas que llegan a una determinada zona
procedentes de una sustancia radiactiva en un corto espacio de tiempo siempre igual,
obteniéndose los siguientes resultados.

Con un nivel de significación del 5%, ¿existe diferencia entre las observaciones de las
partículas ?
Problema No. 1
periodo<-c(120,200,140,20,10,2) Hipótesis:
H0: las variables son
> n<-length(periodo) independientes entre sí.
H1: las variables no son
> chisq.test(periodo) independientes entre sí.

Chi-squared test for given probabilities p<0.05


Se considera significativo.
data: periodo Las variables no son
independientes entre ellas.
X-squared = 416.59, df = 5, p-value < 2.2e-16

Se rechaza H0
se acepta H1
GRÁFICA
#otraforma
> ni <- c(particula0 = 120,
particula1=200 , particula2 = 140 ,
particula3 = 20, particula4 =10,
particula5= 2)
> bp <- barplot(ni / sum(ni), ylim =
c(0,0.6), xlab = "particula", ylab =
"periodos", space = 1)
> abline(h = 0)
> points(bp, rep(0.45, 6), pch = 6)
Problema No. 2
1. Se selecciona al azar a nueve dueños de casa-quinta para participar en un experimento, con el fin de
determinar si hay diferencias en la predilección de tres variedades de grama. Se le pide a cada dueño que
seleccionara tres áreas más o menos iguales y que sembrara en cada una de ellas, al azar, una de las
variedades de grama. Al final de un tiempo especificado se pide a cada dueño que le asignará puntuaciones
de predilección, del uno al cinco; a cada variedad, tomando en cuenta el costo, mantenimiento, belleza,
otros. La puntuación cinco indica el óptimo de preferencia. En el Cuadro 5.2 se muestran los resultados del
experimento.

¿Hay diferencias entre las


variedades gramas?
Hipótesis
Hipótesis de investigación:

Las tres variedades de grama son igualmente preferidas.

Hipótesis estadísticas:

H0 : No hay diferencia entre variedades

H1 : No todas las variedades son iguales


Problema No. 2
#Test de Friedman
> valoracion <- c( 1,3,4,4,2,5,3,1,4,4,3,5,1,2,3,4,3,5,3,2,5,2,5,4,2,1,3) by(data = datos$valoracion,
INDICES = datos$grama, FUN =
> grama <- factor( rep( c( "A", "B", "C" ), 9 ) )
median)
> sujeto <- factor( rep( 1:9, each = 3 ) )
datos$grama: A
> datos <- data.frame( valoracion, grama, sujeto )
[1] 3
> View(datos) -----------------------------------------------
> head(datos) -----
valoracion grama sujeto datos$grama: B
1 1 A 1 [1] 2
2 3 B 1 -----------------------------------------------
3 4 C 1 -----
4 4 A 2 datos$grama: C
5 2 B 2 [1] 4
6 5 C 2
>
Problema No. 2

> library(ggplot2)
> ggplot(data = datos, mapping = aes(x = grama, y = valoración,
colour = grama)) +
+ geom_boxplot() +
+ theme_bw() +
+ theme(legend.position = "none")
> #primera forma
friedman.test(valoración, grama, sujeto)

Friedman rank sum test

data: valoración, grama and sujeto


Friedman chi-squared = 10.889, df = 2, p-value = 0.00432
GRÁFICA DE CAJA: Comparación de las 3 variedades de
grama.
pairwise.wilcox.test(datos$valor
acion, datos$grama, paired =
TRUE, p.adjust.method =
"holm")

Pairwise comparisons
using Wilcoxon signed rank test
with continuity correction

data: datos$valoracion and


datos$grama

A B
B 0.717 -
C 0.023 0.033
Problema No. 3
1. Se estudia el efecto de cuatro diferentes espaciamientos entre surcos sobre el rendimiento de dos
variedades de soya. Los rendimientos en fanegas por acre se muestran en la siguiente tabla. Una fanega
es igual 55.5 litros, y un acre es igual a 4047m2.

Debe de realizar las pruebas de hipótesis, el análisis de varianza, probar los supuestos del modelo, plantear el
modelo, si existen diferencias las comparaciones de medias si hay diferencias e interpretar las conclusiones.
Planteamiento de las hipótesis

#H0: La variable espaciamiento, no afecta los rendimientos de

dos variedades de soya

#H1: La variable espaciamiento afecta los rendimientos de dos

variedades de soya
Modelo matemático
Problema 3
> setwd("C:/Users/Usuario/Documents/script") The following objects are masked from PD
> PD<-read.table("parcelasdivididas.csv",sep = (pos = 6):
";",header = TRUE)
> attach(PD) bosque, pulgadas, rendimiento, variedad
The following objects are masked from PD (pos =
3): > str(PD)
'data.frame': 60 obs. of 4 variables:
$ variedad : int 1 1 1 1 1 1 1 1 1 1 ...
bosque, pulgadas, rendimiento, variedad $ pulgadas : int 18 18 18 18 18 18 24 24
24 24 ...
The following objects are masked from PD (pos = $ bosque : int 1 2 3 4 5 6 1 2 3 4 ...
4): $ rendimiento: num 33.6 37.1 34.1 34.6
35.4 36.1 31.1 34.5 30.5 32.7 ...
bosque, pulgadas, rendimiento, variedad
> # Primera forma usando ANOVA
> anova1<-
aov(rendimiento~bosque+pulgadas+variedad+pulgadas*variedad+Error(b
osque/pulgadas))
> summary(anova1)
Error: bosque
Df Sum Sq Mean Sq
bosque 1 47.68 47.68
Error: bosque:pulgadas
Df Sum Sq Mean Sq
pulgadas 1 33.77 33.77
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
pulgadas 1 223 222.8 2.577 0.11425
variedad 1 827 826.6 9.560 0.00314 **
pulgadas:variedad 1 62 61.8 0.715 0.40168
Residuals 54 4669 86.5
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
> #Análisis de varianza usando la función (sp.plot) Split-Plot
> library(agricolae)
> modelo <-sp.plot(bosque,pulgadas,variedad,rendimiento)
ANALYSIS SPLIT PLOT: rendimiento Para un valor de significancia de 0.05
Class level information
pulgadas : 18 24 30 36 42
variedad : 1 2
bosque : 123456
Number of observations: 60
Analysis of Variance Table
Response: rendimiento
Df Sum Sq Mean Sq F value Pr(>F)
bosque 5 317.31 63.46 NaN NaN
pulgadas 4 210.27 52.57 0.5519 0.699896
Ea 20 1905.07 95.25 NaN NaN
variedad 1 826.59 826.59 8.7081 0.006791 **
pulgadas:variedad 4 229.22 57.31 0.6037 0.663533
Eb 25 2373.03 94.92 NaN NaN
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
cv(a) = 33.2 %, cv(b) = 33.1 %, Mean = 29.42167
#Análisis de varianza usando ANOVA segunda forma
> mod2<-aov(rendimiento~bosque+pulgadas*variedad+bosque/pulgadas)
> summary(mod2) Pruebas de hipótesis para normalidad
Df Sum Sq Mean Sq F value Pr(>F)
H0: Los datos provienen de una distribución
bosque 1 48 47.7 0.552 0.46092
normal
pulgadas 1 2 1.8 0.020 0.88733
variedad 1 827 826.6 9.560 0.00314 ** H1: Los datos no provienen de una distribución
pulgadas:variedad 1 62 61.8 0.715 0.40168 normal.
bosque:pulgadas 1 255 254.8 2.947 0.09175 .
Residuals 54 4669 86.5 R. Los datos no proceden de una
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 distribución normal porque p-value es
> # Prueba de normalidad menor a 0.05
> shapiro.test(mod2$residuals)
Shapiro-Wilk normality test
data: mod2$residuals
W = 0.52777, p-value = 1.325e-12 = 0.000000000001325
> Grupo<-HSD.test(mod2, c("pulgadas","variedad"))
> Grupo
$statistics
MSerror Df Mean CV MSD
86.46049 54 29.42167 31.60396 17.71166
$parameters
test name.t ntr StudentizedRange alpha
Tukey pulgadas:variedad 10 4.665799 0.05
$means
rendimiento std r Min Max Q25 Q50 Q75 $comparison
18:1 35.15000 1.3095801 6 33.6 37.1 34.225 35.00 35.925 NULL
18:2 27.80000 1.3145341 6 25.5 29.4 27.475 28.15 28.300
24:1 31.63333 1.6476246 6 30.3 34.5 30.550 30.90 32.300 $groups
24:2 26.55000 1.9201562 6 23.8 29.7 25.900 26.50 26.950 rendimiento groups
30:1 30.16667 1.7385818 6 27.9 33.0 29.275 30.10 30.700 42:1 39.18333 a
30:2 24.65000 3.0859358 6 21.4 29.5 22.325 24.10 26.325 18:1 35.15000 a
36:1 29.53333 2.1134490 6 26.9 32.3 28.175 29.15 31.175 24:1 31.63333 a
36:2 25.33333 0.7580677 6 24.5 26.4 24.700 25.30 25.825 30:1 30.16667 a
42:1 39.18333 29.8349739 6 18.5 99.4 28.375 28.75 30.775 36:1 29.53333 a
42:2 24.21667 1.2351788 6 22.9 25.7 23.250 23.95 25.325 18:2 27.80000 a
24:2 26.55000 a
36:2 25.33333 a
30:2 24.65000 a
42:2 24.21667 a

attr(,"class")
[1] "group"
COMPARACIÓN DE LAS MEDIAS DE LOS GRUPOS DE
RENDIMIENTO VS VARIEDAD (test-Tukey) con datos sin
transformar

Los grupos no presentan diferencia significativas comparando las medias.


Conclusiones

Problema #1: Existen diferencias entre las observaciones/de partículas, determinada por la
diferencia significativa en la variable periodo, con un p.value de 2.2e-16 en el análisis de
varianza.

Problema #2: Siendo la mediana es un estadístico de posición central, lo que indica en


donde se posiciona el centro de un grupo de datos; seleccionamos la variedad de grama (A),
por presentar una procedencia de los datos de una distribución normal, indicado por la línea
marcada en el centro.

Problema #3: Se obtuvo como resultados que lo que afecta el rendimiento son las
variedades y no el espaciamiento entre surcos. Ya que la variable “variedad” en el análisis de
varianzas resultó presentar diferencias significativas. Los datos no provienen de una
distribución normal.

También podría gustarte