Está en la página 1de 3

#---------------------------------------------------

# PRACTICO 3
# BAIN 091

#leer datos
mis.datitos<-read.table("C:/Users/Magaly/Desktop/CURSOS/CURSOS - 2022/SEGUNDO
SEMESTRE 2022/Practicos/datos2.txt",header=TRUE)

mis.datitos

#----------------------------------------------------------------
#Gráfico de Caja y Bigote

boxplot(mis.datitos$Salario)

boxplot(mis.datitos$Salario,col="green4",main="Boxplot para Salario")

boxplot(mis.datitos$Salario~mis.datitos$NEduc,col=c("pink","green4","orange"))

#----------------------------------------------------------------
#Gráfico de dispersión
plot(mis.datitos$Salario,ylim=c(0,20))
plot(mis.datitos$Edad,type="p",col="red") # p indica puntos de dispersión
plot(mis.datitos$Edad,type="b",col="blue") # b indica lineas uniendo los puntos
de despersión
plot(mis.datitos$Edad,type="o",col="red") # o indice lineas sobreindicadas en
los puntos
plot(mis.datitos$Edad,type="h",col="blue") # h indica lineas verticales sobre
los puntos de dispersión
plot(mis.datitos$Edad,type="l",col="red") # l indica lineas
plot(mis.datitos$Salario,type="s",col="blue") # s indica escalera

#---------------------------------------------------------------
#Extraer subconjuntos de datos de un dataframe
# la sintaxis es subset(x,subset,select)

g1<-subset(mis.datitos,NEduc=="basico",select=c(Salario,Edad,ECivil))
g1

summary(g1)
table(g1$ECivil)
mean(g1$Salario)

g2<-subset(mis.datitos,NEduc=="medio",select=c(Salario,ECivil,Edad))
g2

summary(g2)

boxplot(g1$Salario,g2$Salario)
#---------------------------------------------------------------
#Buscar datos faltantes
is.na(mis.datitos)
summary(mis.datitos)
is.na(mis.datitos$Hijos)

#----------------------------------------------------------------
#instalar paquetes
install.packages("psych")
library(psych)

describe(mis.datitos)

data()

install.packages("agricolae")
library(agricolae)

head(Orange)
?Orange

describe(mis.datitos)
#---------------------------------------------------------------
#Tablas de distribución de frecuencias

Lista <- hist(mis.datitos$Salario,breaks=seq(from=4,to=24,by=4),plot=FALSE)

Tabla1=table.freq(Lista)
Tabla1

install.packages("fdth")
library(fdth)

dist <- fdt(mis.datitos$Salario,breaks="Sturges")


dist
plot(dist, type="cfh")
plot(dist, type="cfp")
plot(dist, type="fh")

dist1 <- fdt(mis.datitos$Salario, start=4, end=24, h=4)


dist1
plot(dist1, type="cfh")
plot(dist1,type="fh",col="green4")
#----------------------------------------------------------
#dividir pantalla gráfica

par(mfrow=c(2,2))
boxplot(mis.datitos$Salario,col="green4",main="Boxplot para Salario")
boxplot(mis.datitos$Salario~mis.datitos$NEduc,col=c("pink","green4","blue3"))
boxplot(mis.datitos$Salario,col="green4",main="Boxplot para Salario")
boxplot(mis.datitos$Salario~mis.datitos$NEduc,col=c("pink","green4","blue3"))

#----------------------------------------------------------
#Eliminar todas las filas que contengan algún valor nulo

datos <- na.omit(mis.datitos)


datos
dim(datos)

#
mean(mis.datitos$Hijos)

mean(mis.datitos$Hijos,na.rm = TRUE) #si encuentra valores perdidos que los omita


summary(datos$Hijos)
summary(mis.datitos$Hijos)
# na significa no asignado
#rm significa "remove" (eliminar)

?na.rm
?mean
table(mis.datitos$Hijos)

table(mis.datitos$Hijos, useNA = "always")

#---------------------------------------------------------
#para obtener una muestra
#veamos los datos cats que están en libreria MASS

#primero llamar libreria


library(MASS)
data()

airquality
head(airquality)
?airquality
dim(airquality)

head(cats)
dim(cats)
summary(cats)

muestra<-cats[sample(1:nrow(cats),5),]
muestra

# fijar semilla

set.seed(245003)
muestra<-cats[sample(1:nrow(cats),5),]
muestra

También podría gustarte