Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Fecha: Duración: 60
minutos
Práctica 1. Tablas de Frecuencias, Histograma y Ojiva
Introducción
En la presente práctica se aplican los conceptos de Tablas de Frecuencias para variables
cualitativas y cuantitativas, Gráficos de Histogramas y Ojivas mediante el uso de
comandos de R. Sobre los datos
Empecemos cargando los datos que se requieren para la práctica, para lo cual
utilizaremos la base de datos Iris incorporada por defecto en Rstudio. Iris es un conjunto
de datos de flores que utilizó Ronald Fisher en un artículo publicado en el año 1936. Está
formado por 50 muestras de cada una de tres especies de Iris (Iris setosa, virginica Iris e
Iris versicolor) y cuatro características que se tomaron en cada muestra: longitud,
anchura de los sépalos y pétalos medidos en centímetros.
Tema 1. Obtención de datos
Obtenga los datos de la tabla Iris y asígnelo al objeto data, luego extraiga los 3 primeros
registros asignados (filas). Muestre los nombres de las columnas extraídas y haga
referencia a la columna Species.
Comandos:
Solución:
data=iris #Asigna los datos de la base iris al objeto data (tabla de
datos Dataframe)
head(data,3) #visualiza las tres primeras filas del objeto data
Solución:
tabla1=table(data$Species)
tabla1
##
## setosa versicolor virginica
## 50 50 50
##
## setosa virginica
## 50 50
##
## setosa versicolor virginica
## 0.3333333 0.3333333 0.3333333
tablaR=cbind(Absoluta=tabla1,Relativa=tabla3)
tablaR
## Absoluta Relativa
## setosa 50 0.3333333
## versicolor 50 0.3333333
## virginica 50 0.3333333
tablaR=cbind(Abosulta=table(data$Species), Relativa=prop.table(table(d
ata$Species))) #sintaxis unificada
tablaR
## Abosulta Relativa
## setosa 50 0.3333333
## versicolor 50 0.3333333
## virginica 50 0.3333333
Solución:
barplot(tabla1, main="Diagrama de barras especies de Iris" , xlab="Tip
os de especies")
Solución:
k=nclass.Sturges(data$Petal.Length)
k
## [1] 9
x=range(data$Petal.Length)
amplitud=(x[2]-x[1])/k #amplitud
amplitud
## [1] 0.6555556
## $breaks
## [1] 1.000000 1.655556 2.311111 2.966667 3.622222 4.277778 4.933333
5.588889
## [9] 6.244444 6.900000
##
## $counts
## [1] 44 6 0 6 17 31 21 19 6
##
## $density
## [1] 0.44745763 0.06101695 0.00000000 0.06101695 0.17288136 0.315254
24 0.21355932
## [8] 0.19322034 0.06101695
##
## $mids
## [1] 1.327778 1.983333 2.638889 3.294444 3.950000 4.605556 5.261111
5.916667
## [9] 6.572222
##
## $xname
## [1] "data$Petal.Length"
##
## $equidist
## [1] TRUE
##
## attr(,"class")
## [1] "histogram"
#install.packages("agricolae")
library(agricolae)
Solución:
install.packages("fdth") #instlación del paquete
library(fdth)
##
## Attaching package: 'fdth'
# k<-1 + (3.322*log10(150))
# k
k=nclass.Sturges(data$Petal.Length)
k
## [1] 9
tablaR1
print("*************************************")
## [1] "*************************************"
tablaR2=fdt(data$Petal.Length, k, right = F)
tablaR2
print("*************************************")
## [1] "*************************************"
Obs: Observe que existe una diferencia por precisión entre las Tablas
de Frecuencias obtenida por los comandos hist vs fdt.
library(agricolae)
tablaR=table.freq(hist(data$Petal.Length, breaks = limites, include.lo
west = T, right = T, plot = F))
tablaR
Solución:
library(fdth)
dist=fdt(data$Sepal.Length, breaks="Sturges")
hist(data$Sepal.Length, breaks = "Sturges")
#histograma frecuencia relativas (probability Density) se configura fr
eq=F
#curva de la normal
lines(density(data$Sepal.Length), col="blue", lwd=3) # dibujamos la d
istribución normal empírica con los datos que tenemos
plot(dist, type="cfh")
plot(dist, type="cfp")
x=range(data$Sepal.Length)
k=(x[2]-x[1])/5
aux=fdt(data$Sepal.Length,start=4.3,h=k,end=7.9) #h=0.72 crea 5 inter
valos
plot(aux,type="cfp",xlab="Sépalo longitud",ylab="Frecuencia absoluta a
cumulada")
Tema 11. Polígono de frecuencia y Ojiva (segunda forma)
Elabore un polígono de frecuencia y la ojiva asociado a la variable de longitud de sépalos.
Comandos:
plot(x,y, main="“, xlab=”“, ylab=”") #plotea el punto (x,y), los parámetros main para
especificar título de gráfio, xlab etiqueta eje x, y ylab etiqueta eje y.
sum(x) #suma todos los datos del vector x
cumsum(x) #suma acumulada hasta cada posición del elemento en x, suma acumulada
(Xi)=X1+X2+…+Xi-1
Solución:
tabla=hist(data$Sepal.Length, breaks="Sturges", plot=F)
plot(tabla$mids,tabla$counts, main="Poligono de frecuencia absoluta",
xlab = "Marca de clase")
lines(tabla$mids,tabla$counts, type="l")
plot(tabla$mids,cumsum(tabla$counts), main="Ojiva de frecuencia absolu
ta", xlab = "Marca de clase")
lines(tabla$mids,cumsum(tabla$counts), type="l")