Documentos de Académico
Documentos de Profesional
Documentos de Cultura
filter(DF,Estatura>=175,Signo=="Acuario"|Signo=="Piscis"|Signo=="Virgo")#segunda
forma
x<- DF$Signo
table(x,useNA="always")[(table(x,useNA="always")==max(table(x),na=rm=T))]
//se define la moda de la variable signo
-------------------------------------------------------------------------
rango <- max(DF$Estatura) - min(DF$Estatura) //rango de la variable estatura
sd(DF$Peso, na.rm=T) //Desviacion estandar de la variable peso
IQR(DF$Edad, na.rm=True) //rango intercuartil
var(DF$Peso,na.rm=T)
-------------------------------------------------------------
¿Como crear una funcion?
cv<- funcion(x){
return(sd(x,na.rm=T)/mean(x,na.rm=T))
//coeficiente de variación de la variable
----------------------------------------------------------------------------
###Descriptores numericos para una variable
mean(DF$Estatura, na.rm=T) //media de la variable estatura
median(DF$Estatura, na.rm=T) //mediana de la variable estatura
--------------------------------------------------------------------
plot(DF$Estatura,DF$Peso)
plot(DF$Estatura,DF$Peso, pch=20) //solo puntos
Circulos con transparencia
plot(DF$Estatura,DF$Peso, pch=20, col=rgb)
//Usamos transparencia para visualizar mejor la nubve, con RGB (rojo, azul y verde)
plot(DF$Estatura,DF$Peso, pch=20, col=rgb(0,0,0,0.2)
-----------------------------------------------------------------------------------
--------------------------
para graficar la recta de regresion lineal
plot(DF$Peso, DF$Estatura, pch=20, col=rgb(0,0,0,0.2),main="Estatura Vs Peso",
xlab="Peso (en kg)", ylab="Estatura (en cms)")
abline(lm(DF$Estatura ~ DF$Peso), col="red")
-----------------------------------------------------------------------------------
--------------------
Vamos a hacer una grafica de dispersion a color, diferenciados por sus sexos
plot(DF$Peso[DF$Sexo=="F"], DF$Estatura[DF$Sexo=="F"],pch=20, col=rgb(0,0,0,0,0.2),
main="Estatura vs Peso", xlab="Peso (en kg), ylab="Estatura (en cms)")
abline(lm(DF$Estatura[DF$Sexo=="F"]|[DF$Sexo=="f"] ~ DF$Peso[DF$Sexo=="F"|
DF$Sexo=="f"]),col="red")
abline(lm(DF$Estatura[DF$Sexo=="M"]|[DF$Sexo=="m"] ~ DF$Peso[DF$Sexo=="M"|
DF$Sexo=="m"]),col="blue")
cor(DF$Peso,DF$Estatura, use="complete.obs")
cor(DF$Peso[DF$Sexo=="F"|DF$Sexo=="f"], DF$Estatura[DF$Sexo=="F"|DF$Sexo=="f"],
use="complete.obs")
cor(DF$Peso[DF$Sexo=="M"|DF$Sexo=="m"], DF$Estatura[DF$Sexo=="M"|DF$Sexo=="m"],
use="complete.obs")
Notas adicionales
Datos faltantes
sum(is.na(DF))
datos completos
sum(!is.na(DF))
DF[which.max(rowSums(is.na(DF))),"Carrera"]
tamaño efectivo de la muestra de la variable/
cat('Número de observaciones válidas:',nrow(DF)-sum(is.na(DF$Peso)),'\n')
#calcula el número de pesos válidas (no na's)
## Número de observaciones válidas: 317
cat('Proporción de observaciones
válidas:',round((nrow(DF)-sum(is.na(DF$Peso)))/nrow(DF)*100,2),'\n')
-------------------------------------------------------
DATOS ATIPICOS
DEMASIADOS GRANDES
sum(boxplot.stats(DF$Edad)$out>boxplot.stats(DF$Edad)$stats[5])
DEMASIADOS PEQUEÑOS
sum(boxplot.stats(DF$Edad)$out<boxplot.stats(DF$Edad)$stats[1])
plot(yr[2:length(n)], tasa)
for (i in 7:length(n)) {
n[i] <- n[i - 1] * lambda
}
plot(yr, n)
n0 <- 2
tiempo <- 0:11
nt <- n0 * lambda^tiempo
plot(tiempo, nt)
}
n0 <- 2
n <- numeric(20)
n[1] <- n0
for (t in 1:(length(n) - 1)) {
n[t + 1] <- n[t] + rd * n[t] * (1 - n[t]/K)
}
---------------------------------
Se agrega una nueva columna
dfPersonas$AgeGt20 <- dfPersonas$Age > 20
dfPersonas