REQUISITOS MÍNIMOS
En la resolución de cada uno de los ejercicios debe indicar los pasos realizados con
capturas de pantalla (incluyendo paquetes instalados).
También adjunte los archivos trabajados para dar seguimiento y para mejor corrección
de la tarea.
Todo lo solicitado debe encontrarse dentro de una carpeta comprimida con el siguiente
nombre: TAREA_ANÁLISIS_ESTADÍSTICO_R_S2_APELLIDOS
TAREA
Gastos
Se cuenta con los gastos (en nuevos soles) realizados por 100 estudiantes de maestría de la
UNMSM durante un semestre académico:
5434 4806 4848 4609 5342 5621 5296 5348 5498 4417
4948 4637 5378 4772 5069 4918 4965 5245 4681 5364
4521 5670 5260 5133 4755 5138 5170 4723 5076 5640
4570 4381 5055 5095 4925 4786 4740 5275 4774 5969
4990 4820 5828 4618 5001 4500 5173 5419 4931 5188
5702 5043 5218 4848 4803 5461 4568 5205 4493 5764
5241 4886 4859 5089 4951 5049 5653 4452 5309 5273
5112 4599 4780 5518 5679 4974 5078 5227 5582 5042
5015 5288 5027 5333 5256 4592 4900 5555 4308 5189
4659 5299 5008 5164 5207 4173 4698 5388 4823 4986
gastos
a) (2 ptos) Construya una tabla de distribución de frecuencias absolutas, relativas,
absolutas acumuladas y relativas acumuladas usando la regla de Sturges.
n<-length(gastos)
n
Encontrando el rango de los datos
rango<-max(gastos)-min(gastos)
rango
Aplicando sturges para encontrar la cantidad o número de intervalos
k<-round(1+3.3*log10(n))
k
Hallando la amplitud
amplitud<-rango/k
amplitud
Matriz de 2 columnas y 8 filas
L<-matrix(data=NA,nrow=k,ncol=2)
L[1,1]<-min(gastos)
L[k,2]<-max(gastos)
for (i in 1:7)
{
L[i,2]=L[i,1]+amplitud
L[i+1,1]=L[i,2]
}
L
Convirtiendo en dataframe
L<-data.frame(L)
colnames(L)<-c("Inter. Inferior","Inter. Superior")
L
Marca de clase
Mclase=numeric(k)
for (i in 1:k){
Mclase[i]=(L[i,1]+L[i,2])/2
}
Mclase=round(Mclase,2)
Freq=numeric(k)
for (i in 1:k){
Freq[i]=length(gastos[gastos<=L[i,1]&gastos<L[i,2]])
}
Frecuencia acumulada
FreqAc=cumsum(Freq)
Frecuencia relativa
Rel=round(Freq/sum(Freq),4)
Frecuencia relativa acumulada
RelAc=round(cumsum(Rel),4)
Tabla de frecuencia
TablaFrecuencia=data.frame(L,Mclase,Freq,FreqAc,Rel,RelAc)
print(TablaFrecuencia)
k<-10
Hallando la amplitud
amplitud<-rango/k
amplitud
Matriz de 2 columnas y 10 filas
L<-matrix(data=NA,nrow=k,ncol=2)
L[1,1]<-min(gastos)
L[k,2]<-max(gastos)
for (i in 1:9)
{
L[i,2]=L[i,1]+amplitud
L[i+1,1]=L[i,2]
}
L
Convirtiendo en dataframe
L<-data.frame(L)
colnames(L)<-c("Inter. Inferior","Inter. Superior")
L
Marca de clase
Mclase=numeric(k)
for (i in 1:k){
Mclase[i]=(L[i,1]+L[i,2])/2
}
Mclase=round(Mclase,2)
Freq=numeric(k)
for (i in 1:k){
Freq[i]=length(gastos[gastos<=L[i,1]&gastos<L[i,2]])
}
Frecuencia acumulada
FreqAc=cumsum(Freq)
Frecuencia relativa
Rel=round(Freq/sum(Freq),4)
Frecuencia relativa acumulada
RelAc=round(cumsum(Rel),4)
Tabla de frecuencia
TablaFrecuencia=data.frame(L,Mclase,Freq,FreqAc,Rel,RelAc)
print(TablaFrecuencia)
c) (3 ptos) Construya un histograma de frecuencias absolutas.
Frecuencia absoluta
fi<-table(gastos)
fi
data.frame(fi)
Histograma
hist(gastos,main="Mi
histograma",xlab="gastos",ylab="frecuencia de
gastos",col="lightgreen",border="darkgreen")
hist(gastos,main="Mi
histograma",xlab="gastos",ylab="frecuencias de
gastos",col="turquoise",border="darkgreen",prob=TRUE)
lines(density(gastos),lwd=2.5, col="darkblue")
e) (5 ptos) Realice un diagrama circular tomando en cuenta lo siguiente:
gasto<-rep(NA,length(gastos))
gasto[gastos<=4700]<-'=4700'
gasto[gastos>4700 & gastos<=5500]<-'entre 4701 y 5500'
gasto[gastos>5501]<-'=5500'
Calcular las frecuencias:
frecuencia<-table(gasto)
etiquetas<-paste("hay",frecuencia,"con
gastos\n",names(frecuencia))
pie(frecuencia,main="Grafica
circular",col=rainbow(length(frecuencia)),labels=etiquetas)
f) (3 ptos) Realice un diagrama de barras de las frecuencias de los grupos A, B y C.
frecuencia<-table(gasto)
barplot(frecuencia,main="grafico de
barras",xlab="gastos",ylab="frecuencia
absoluta",col="lightgreen",border="darkgreen")