Está en la página 1de 6

# Vamos a estudiar el tiempo de recarga de la bateria de un coche (variable estudiada) en

funcion de la cantidad de oro que introduzcamos en ella. Solo tendriamos un factor (cantidad
de oro), con 3 niveles (nooro, ciengramos y quinientosgramos) con un total de 30
observaciones, como hay 3 tratamientos se ha seguido un diseño balanceado (10 replicas por
cada nivel del factor)

basededatos <- read.csv("ejuno.csv", header=TRUE,sep=",",stringsAsFactors = TRUE)

library(RcmdrMisc)

#analisis basicorro

summary(tiempo~oro, data=basededatos)

#analisis con mas informacion

numSummary(basededatos$tiempo, groups = basededatos$oro,statistics=c("mean","sd","IQR",


"quantiles", quantiles=c(0,.25,.5,.75,1)))

colores<-c("green","blue","orange")

dotchart(basededatos$tiempo, groups = basededatos$oro, labels=basededatos$oro,


xlab=tiempo,cex=1.1,color=colores[basededatos$oro])

plotMeans(basededatos$tiempo, basededatos$oro)

t.test(basededatos$tiempo[basededatos$oro=="ciengramos"])$conf.int

t.test(basededatos$tiempo[basededatos$oro=="nooro"])$conf.int

t.test(basededatos$tiempo[basededatos$oro=="quinientosg"])$conf.int

#Test ANOVA, Ho-> El tiempo es el mismo cndo no se usa oro que con 100g o 500g.

mimodelo<-aov(tiempo~oro, data=basededatos)

summary(mimodelo)

#Pvalor -> No hay evidencia suficiente para afirmar Ho

mean(basededatos$tiempo) # media global

#distribucion cuando no hay nada de oro, coge la sd de summary(mimodelo)y la media del


t.test cuando nooro, el int de confianza tmbien se saca de t.test

#A la vista de los resultados anteriores se decidiria no usar oro pq no reduce


significativamente los tiempos de recarga

#COMPROBACION HIPOTESIS DEL MODELO

#NORMALIDAD DE ERRORES (Ho: Los errores siguen una DN)

shapiro.test(mimodelo$residuals) #pvalor < alfa NO SIGUE DN


#ESTUDIO TMBIEN NORMALIDAD DATOS AUNQ NO NECESARIO (por los pelos raro)

normalityTest(tiempo~oro,test="shapiro.test", data=basededatos)

#HOMOCEDASTICIDAD

bartlett.test(tiempo~oro, data=basededatos) #no rechazo homocedast.

#GRAFICAS BASICAS DE DIAGNOSTICO

plot(mimodelo, which=1)

plot(mimodelo, which=2)

plot(mimodelo, which=3)

plot(mimodelo, which=4)

plot(mimodelo, which=5)

# no veo nada raro, pero no se satisface DN en los errores, por tanto realizo KRUSKAL WALIS
QUE TIENE MISMA Ho que ANOVA

kruskal.test(tiempo~oro, data=basededatos) #identica conclusion q anova

######################################## EJERCICIO2

datitos<-read.csv("ejdos.csv", header=TRUE,sep=",",stringsAsFactors = TRUE)

summary(tiempo~oro, data=datitos)

#analisis con mas informacion

numSummary(datitos$tiempo, groups = datitos$oro, statistics = c("mean","sd","IQR",


"quantiles", quantiles=c(0,.25,.5,.75,1)))

colores<-c("green","blue","orange","black")

dotchart(datitos$tiempo, groups = datitos$oro, labels=datitos$oro,


xlab=tiempo,cex=1.1,color=colores[datitos$oro])

plotMeans(datitos$tiempo, datitos$oro)

t.test(datitos$tiempo[datitos$oro=="ciengramos"])$conf.int

t.test(datitos$tiempo[datitos$oro=="nooro"])$conf.int

t.test(datitos$tiempo[datitos$oro=="quinientosg"])$conf.int

t.test(datitos$tiempo[datitos$oro=="unkilo"])$conf.int
#Test ANOVA, Ho-> El tiempo es el mismo cndo no se usa oro que con 100g o 500g.

mimodelo2<-aov(tiempo~oro, data=datitos)

summary(mimodelo2)

#Pvalor muy pequeño-> RECHAZO Ho, AL MENOS 2 cantidades de oro producen menores
tiempos significativamente

mean(datitos$tiempo) # media global

#APLICO TUKEY PARA COMPARAR PAREJAS DE TRATAMIENTO

library(agricolae)

HSD.test(mimodelo2, trt="oro", console = TRUE, alpha=.05)

#CONCLUIMOS Q 100 gramos y 500g obtienen medias similares y son significativamente


equivalentes. lo mismo nos pasa con un kilo y no oro.

#COMPROBACION AXIOMAS DEL MODELO

#NORMALIDAD DE ERRORES (Ho: Los errores siguen una DN)

shapiro.test(mimodelo2$residuals) #pvalor >alfa BIEEEEN DN

#ESTUDIO TMBIEN NORMALIDAD DATOS AUNQ NO NECESARIO (BIEEEN)

normalityTest(tiempo~oro,test="shapiro.test", data=datitos)

#HOMOCEDASTICIDAD

bartlett.test(tiempo~oro, data=datitos) #no rechazo homocedast.

#GRAFICAS BASICAS DE DIAGNOSTICO

plot(mimodelo2, which=1)

plot(mimodelo2, which=2)

plot(mimodelo2, which=3)

plot(mimodelo2, which=4)

plot(mimodelo2, which=5)

#TODO GENIAL
##########EJ 3

#Ahora consideramos que la marca de la bateria tambien podria influir en el tiempo de


recarga

datos<-read.csv("ejtres.csv", sep=",", stringsAsFactors = TRUE)

#Idealmente, se ha seguido un diseño aleatorio y balanceado donde la variable respuesta es


el tiempo y los factores son la marca y la cantidad de oro

#DESCRIPCION DE LOS DATOS

#dependiendo de la marca:

numSummary(datos$tiempo, groups=datos$marca)

#dependiendo del oro

numSummary(datos$tiempo, groups=datos$oro)

#Creamos el modelo anova

modelo<-aov(tiempo~oro*marca, data=datos)

summary(modelo)

#comprobamos que el efecto de la interaccion se puede despreciar,

#creamos un modelo despreciando la interaccion (modelo ADITIVO como vimo clase)

mejoranova<-aov(tiempo~oro+marca, data=datos)

summary(mejoranova)

#Estimacion puntual de los parametros

mean(datos$tiempo)

model.tables(mejoranova)

model.tables(mejoranova, type="means")

#Compruebo las hipotesis del modelo

shapiro.test(mejoranova$residuals) #bien

bartlett.test(datos$tiempo~datos$marca)

bartlett.test(datos$tiempo~datos$oro) #bien ambas


#HSDTUKEY

library(agricolae)

library(PMCMRplus)

TukeyHSD(mejoranova,trt=c("marca","oro"), p.adj="holm", console=TRUE, conf.level =0.95)

#Concluimos que no hay diferencias significativas entre 1kg y 100g de oro, ni entre 500g o 0g
de oro. Asi mismo, tampoco hay dif. signif. entre las marcas A-D ni entre C-B

#Esojo CIEN GRAMOS y la marca mas barata entre A y D

#calidad del modelo

summary(lm(tiempo~marca+oro,datos))

#R^2=73,87% y R^2ajustado=72,11%

#EJERCICIO 4

#Idealmente se ha seguido un diseño factorial con 3 factores (marca, oro y posicion) y n=7
replicas.

datazos<-read.csv("ejcuatro.csv",sep=",", stringsAsFactors = TRUE)

xtabs(~marca+oro+posicion, data=datazos)

#Creo ANOVA

modelazo<-aov(tiempo~marca*posicion*oro, data=datazos)

model.tables(modelazo)

model.tables(modelazo, type="means")

summary(modelazo)

#De la tabla ANOVA del modelo completo (con todos los posibles términos) concluimos que
el factor marca es significativo, así como el factor oro y una interacción posición-oro

#Obtenemos el mejoranova

mejormodelazo<-aov(tiempo~marca+oro+oro:posicion, data=datazos)

summary(mejormodelazo)
#Validez del modelo

shapiro.test(mejormodelazo$residuals)

qqPlot(mejormodelazo$residuals)

bartlett.test(tiempo~marca, data=datazos)

bartlett.test(tiempo~oro, data=datazos)

bartlett.test(tiempo~interaction(oro,posicion), data=datazos)

# TukeyHSD

library(agricolae)

library(PMCMRplus)

TukeyHSD(mejormodelazo)

#No hay diferencias entre escoger la marca A o B, da igual la cantidad de oro (asique no
cogemos nada) y la posicion da igual tambien (la que mejor convenga)

model.tables(mejormodelazo,type="means")

#El tiempo medio global es 86,9h, si escogemos la Marca A aumenta 12h, con la marca B
aumenta 6 y con la marca C se disminuye 18h

#Como hay interaccion entre oro y posicion los estudiamos conjuntamente, siendo la mejor
opcion 100g y arriba.

También podría gustarte