Está en la página 1de 8

SESIÓN 2

REQUISITOS MÍNIMOS

 En la resolución de cada uno de los ejercicios debe indicar los pasos realizados con
capturas de pantalla (incluyendo paquetes instalados).

 También adjunte los archivos trabajados para dar seguimiento y para mejor corrección
de la tarea.

 Todo lo solicitado debe encontrarse dentro de una carpeta comprimida con el siguiente
nombre: TAREA_ANÁLISIS_ESTADÍSTICO_R_S2_APELLIDOS

TAREA

Gastos

Se cuenta con los gastos (en nuevos soles) realizados por 100 estudiantes de maestría de la
UNMSM durante un semestre académico:

5434 4806 4848 4609 5342 5621 5296 5348 5498 4417

4948 4637 5378 4772 5069 4918 4965 5245 4681 5364

4521 5670 5260 5133 4755 5138 5170 4723 5076 5640

4570 4381 5055 5095 4925 4786 4740 5275 4774 5969

4990 4820 5828 4618 5001 4500 5173 5419 4931 5188

5702 5043 5218 4848 4803 5461 4568 5205 4493 5764

5241 4886 4859 5089 4951 5049 5653 4452 5309 5273

5112 4599 4780 5518 5679 4974 5078 5227 5582 5042

5015 5288 5027 5333 5256 4592 4900 5555 4308 5189

4659 5299 5008 5164 5207 4173 4698 5388 4823 4986

Realizar las siguientes operaciones en R:

Primero subimos los datos

gastos<-c(5434, 4806, 4848, 4609, 5342, 5621, 5296, 5348,


5498, 4417, 4948, 4637, 5378, 4772, 5069, 4918, 4965, 5245,
4681, 5364, 4521, 5670, 5260, 5133, 4755, 5138, 5170, 4723,
5076, 5640, 4570, 4381, 5055, 5095, 4925, 4786, 4740, 5275,
4774, 5969, 4990, 4820, 5828, 4618, 5001, 4500, 5173, 5419,
4931, 5188, 5702, 5043, 5218, 4848, 4803, 5461, 4568, 5205,
4493, 5764, 5241, 4886, 4859, 5089, 4951, 5049, 5653, 4452,
5309, 5273, 5112, 4599, 4780, 5518, 5679, 4974, 5078, 5227,
5582, 5042, 5015, 5288, 5027, 5333, 5256, 4592, 4900, 5555,
4308, 5189, 4659, 5299, 5008, 5164, 5207, 4173, 4698, 5388,
4823, 4986)

gastos
a) (2 ptos) Construya una tabla de distribución de frecuencias absolutas, relativas,
absolutas acumuladas y relativas acumuladas usando la regla de Sturges.

Para un vector de datos, la longituda de los datos

n<-length(gastos)
n
Encontrando el rango de los datos

rango<-max(gastos)-min(gastos)
rango
Aplicando sturges para encontrar la cantidad o número de intervalos

k<-round(1+3.3*log10(n))
k
Hallando la amplitud

amplitud<-rango/k
amplitud
Matriz de 2 columnas y 8 filas

L<-matrix(data=NA,nrow=k,ncol=2)
L[1,1]<-min(gastos)
L[k,2]<-max(gastos)
for (i in 1:7)
{
L[i,2]=L[i,1]+amplitud
L[i+1,1]=L[i,2]
}
L
Convirtiendo en dataframe

L<-data.frame(L)
colnames(L)<-c("Inter. Inferior","Inter. Superior")
L
Marca de clase

Mclase=numeric(k)
for (i in 1:k){
Mclase[i]=(L[i,1]+L[i,2])/2
}
Mclase=round(Mclase,2)
Freq=numeric(k)
for (i in 1:k){
Freq[i]=length(gastos[gastos<=L[i,1]&gastos<L[i,2]])
}
Frecuencia acumulada

FreqAc=cumsum(Freq)
Frecuencia relativa
Rel=round(Freq/sum(Freq),4)
Frecuencia relativa acumulada

RelAc=round(cumsum(Rel),4)
Tabla de frecuencia

TablaFrecuencia=data.frame(L,Mclase,Freq,FreqAc,Rel,RelAc)
print(TablaFrecuencia)

b) (2 ptos) Construya una tabla de distribución de frecuencias absolutas, relativas,


absolutas acumuladas y relativas acumuladas considerando 10 intervalos de clase

Considerando sturges =10

k<-10
Hallando la amplitud

amplitud<-rango/k
amplitud
Matriz de 2 columnas y 10 filas

L<-matrix(data=NA,nrow=k,ncol=2)
L[1,1]<-min(gastos)
L[k,2]<-max(gastos)
for (i in 1:9)
{
L[i,2]=L[i,1]+amplitud
L[i+1,1]=L[i,2]
}
L
Convirtiendo en dataframe

L<-data.frame(L)
colnames(L)<-c("Inter. Inferior","Inter. Superior")
L
Marca de clase

Mclase=numeric(k)
for (i in 1:k){
Mclase[i]=(L[i,1]+L[i,2])/2
}
Mclase=round(Mclase,2)
Freq=numeric(k)
for (i in 1:k){
Freq[i]=length(gastos[gastos<=L[i,1]&gastos<L[i,2]])
}
Frecuencia acumulada

FreqAc=cumsum(Freq)
Frecuencia relativa

Rel=round(Freq/sum(Freq),4)
Frecuencia relativa acumulada

RelAc=round(cumsum(Rel),4)
Tabla de frecuencia

TablaFrecuencia=data.frame(L,Mclase,Freq,FreqAc,Rel,RelAc)
print(TablaFrecuencia)
c) (3 ptos) Construya un histograma de frecuencias absolutas.

Frecuencia absoluta

fi<-table(gastos)
fi
data.frame(fi)
Histograma

hist(gastos,main="Mi
histograma",xlab="gastos",ylab="frecuencia de
gastos",col="lightgreen",border="darkgreen")

d) (2 ptos) Construya un histograma mostrando la curva de densidad.

hist(gastos,main="Mi
histograma",xlab="gastos",ylab="frecuencias de
gastos",col="turquoise",border="darkgreen",prob=TRUE)
lines(density(gastos),lwd=2.5, col="darkblue")
e) (5 ptos) Realice un diagrama circular tomando en cuenta lo siguiente:

Grupo A: Gasto menor o igual a S/. 4700


Grupo B: Gasto mayor a S/. 4700 pero menor o igual que S/.5500
Grupo C: Gasto mayor a S/. 5500
Dicho diagrama debe tener como etiquetas al nombre del grupo y el porcentaje que
representa.
Ejemplo: “A: 15%”

Crear la variable ingreso en referencia a cada grupo

gasto<-rep(NA,length(gastos))
gasto[gastos<=4700]<-'=4700'
gasto[gastos>4700 & gastos<=5500]<-'entre 4701 y 5500'
gasto[gastos>5501]<-'=5500'
Calcular las frecuencias:

frecuencia<-table(gasto)
etiquetas<-paste("hay",frecuencia,"con
gastos\n",names(frecuencia))
pie(frecuencia,main="Grafica
circular",col=rainbow(length(frecuencia)),labels=etiquetas)
f) (3 ptos) Realice un diagrama de barras de las frecuencias de los grupos A, B y C.

frecuencia<-table(gasto)
barplot(frecuencia,main="grafico de
barras",xlab="gastos",ylab="frecuencia
absoluta",col="lightgreen",border="darkgreen")

g) (3 ptos) Realice un diagrama de tallo y hojas usando la columna “mpg” de la data


“mtcars”
dato<-mtcars["mpg"]
dato
stem(dato$mpg)

También podría gustarte