Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2023-05-03
#IMPORTAR DATOS
Para comenzar analizar sus bases de datos debemos cargarla al Rstudio
En este caso cargaremos la base de datos iris que se encuentra incluida en Rstudio
data("iris")
iris
## [1] 150 5
## [1] 5
## $Sepal.Length
## [1] "numeric"
##
## $Sepal.Width
## [1] "numeric"
##
## $Petal.Length
## [1] "numeric"
##
## $Petal.Width
## [1] "numeric"
##
## $Species
## [1] "factor"
Otras funciones
median(iris$Sepal.Length)
## [1] 5.8
mean(iris$Sepal.Length)
## [1] 5.843333
Para observar los datos de una variable, asignamos $
especie=iris$Species
especie
iris$Petal.Width
## [1] 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 0.2 0.2 0.1 0.1 0.2 0.4
0.4 0.3
## [19] 0.3 0.3 0.2 0.4 0.2 0.5 0.2 0.2 0.4 0.2 0.2 0.2 0.2 0.4 0.1 0.2
0.2 0.2
## [37] 0.2 0.1 0.2 0.2 0.3 0.3 0.2 0.6 0.4 0.3 0.2 0.2 0.2 0.2 1.4 1.5
1.5 1.3
## [55] 1.5 1.3 1.6 1.0 1.3 1.4 1.0 1.5 1.0 1.4 1.3 1.4 1.5 1.0 1.5 1.1
1.8 1.3
## [73] 1.5 1.2 1.3 1.4 1.4 1.7 1.5 1.0 1.1 1.0 1.2 1.6 1.5 1.6 1.5 1.3
1.3 1.3
## [91] 1.2 1.4 1.2 1.0 1.3 1.2 1.3 1.3 1.1 1.3 2.5 1.9 2.1 1.8 2.2 2.1
1.7 1.8
## [109] 1.8 2.5 2.0 1.9 2.1 2.0 2.4 2.3 1.8 2.2 2.3 1.5 2.3 2.0 2.0 1.8
2.1 1.8
## [127] 1.8 1.8 2.1 1.6 1.9 2.0 2.2 1.5 1.4 2.3 2.4 1.8 1.8 2.1 2.4 2.3
1.9 2.3
## [145] 2.5 2.3 1.9 2.0 2.3 1.8
iris$Species
Cuando queremos observar [a,b], donde a son las filas y b las columnas o
variables
iris[25:30,]
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 25 4.8 3.4 1.9 0.2 setosa
## 26 5.0 3.0 1.6 0.2 setosa
## 27 5.0 3.4 1.6 0.4 setosa
## 28 5.2 3.5 1.5 0.2 setosa
## 29 5.2 3.4 1.4 0.2 setosa
## 30 4.7 3.2 1.6 0.2 setosa
iris[25:30,3:4]
## Petal.Length Petal.Width
## 25 1.9 0.2
## 26 1.6 0.2
## 27 1.6 0.4
## 28 1.5 0.2
## 29 1.4 0.2
## 30 1.6 0.2
Modificación de Etiquetas
hist(iris$Sepal.Length,col="red",main="Longitud Sépalo",
xlab="Longitud",ylab="Cantidad de plantas",las=1,label=TRUE)
Modificación del número máximo eje vertical
hist(iris$Sepal.Length,col="red",main="Longitud Sépalo",
xlab="Longitud",ylab="Cantidad de plantas",las=1,label=TRUE,
ylim=c(0,40))
Para visualizar más de un diagrama a la vez ocupamos par(mfrow=c(a,b)) a y b son
números, que me indican la cantidad de diagramas de van en la fila y la cantidad de
diagramas que van en las columnas
par(mfrow=c(1,2))
La función cex modifica el tamaño de letra
par(mfrow=c(1,1),cex=1)
También podemos modificar los colores de la barra indicando
col=c(“red”,“blue”,“green”) o col=rainbow(5)
###Diagrama de densidad
Este diagrama visualiza la distribución de datos en un intervalo o periodo de tiempo
continuo. Este gráfico es una variación de un Histograma que usa el suavizado de cerner
para trazar valores, permitiendo distribuciones más suaves al suavizar el ruido.
Gráfico inicial: plot(density(data$variable)): este gráfico muestra la frecuencia
relativa
plot(density(iris$Sepal.Length))
Modificar título y eje Y
plot(density(iris$Sepal.Length),main="Longitud S?palo",ylab="Densidad")
Para dejar horizontal los valores del eje Y las=1
plot(density(iris$Sepal.Length),main="Longitud Sépalo",ylab="Densidad",la
s=1)
Modificamos el eje Y
plot(density(iris$Sepal.Length),main="Longitud Sépalo",ylab="Densidad",
las=1,ylim=c(0,0.4))
####DIAGRAMA DE CAJA
El Diagrama de caja (boxplot o bigote): Es un método estandarizado para representar
graficamente una serie de datos numéricos a través de sus cuartiles. De esta manera, el
diagrama de caja muestra a simple vista la mediana y los cuartiles de los datos,
pudiendo también representar los valores atípicos de estos. (outliers)
Graficamos el boxplot con la siguiente función boxplot(data$variable)
boxplot(iris$Sepal.Width)
Para mejorar nuestro gráfico
boxplot(iris$Sepal.Width,main="Longitud Sépalo",ylab="Longitud",las=1,col
="brown")
Algunas ventajas
boxplot(iris$Sepal.Length,iris$Sepal.Width,iris$Petal.Length,iris$Petal.W
idth,
col=c("red","green","brown","yellow"))