Documentos de Académico
Documentos de Profesional
Documentos de Cultura
library(haven)
datos<-read.csv(file.choose())
View(datos)
#------------------------------------------------------------------------------
# usuarios del sistema (cnt) para cada estación del año (season).
datos$cnt
datos$season
#segun estacione:
#inVierno
ecdf(datos$cnt[datos$season==1])
invierno<-ecdf(datos$cnt[datos$season==1])
plot(invierno,
#primavera
ecdf(datos$cnt[datos$season==2])
primavera<-ecdf(datos$cnt[datos$season==2])
plot(primavera,
add=TRUE,
col=2)
#verano
ecdf(datos$cnt[datos$season==3])
verano<-ecdf(datos$cnt[datos$season==3])
plot(verano,
add=TRUE,
col=3)
#otoño
ecdf(datos$cnt[datos$season==4])
otoño<-ecdf(datos$cnt[datos$season==4])
plot(otoño,
add=TRUE,
col=4)
abline(h=0.5,col=2,lty=2)
abline(h=0.25,col=2,lty=2)
abline(h=0.75,col=2,lty=2)
# mediana del número total de usuarios del sistema en verano es mayor que
# en invierno”.
# VERDADERO, se observa del grafico que verano tiene una mayor media (199) que
# invierno (76)
median(datos$cnt[datos$season==3]) #199 mediana de verano
#TRUE
IQR(datos$cnt[datos$season==1])<IQR(datos$cnt[datos$season==3])
#TRUE
#------------------------------------------------------------------------------
summary(datos$cnt)
# Min. 1st Qu. Median Mean 3rd Qu. Max.
# b) (1.0 punto) “En esta ciudad, el nivel de Humedad (hum) presenta mayor
length(boxplot(datos$hum)$out)>length(boxplot(datos$windspeed)$out)
#velocidad del viento con 342 a comparacion del nivel de humedad con 22 datos.
# ocasionales del sistema en una hora (casual) es el mismo para días feriados
# Justifique su respuesta.
mean(datos$casual[datos$holiday==1])
#44.718
mean(datos$casual[datos$holiday==0])
#35.40838
#FALSO, la media de usuarios ocasionales respecto a los dias que son feriado (44.72)
# número total de usuarios del sistema en una hora (cnt) es adecuado usar
# Justifiquesu respuesta
mean(datos$cnt)
boxplot(datos$cnt)
length(boxplot(datos$cnt)$out)
#FALSO, porque la media es afectada por los valores atipicos por ende no seria
#------------------------------------------------------------------------------
boxplot(datos$registered~datos$hr,
xlab = "Hora",
boxplot(datos$casual~datos$hr,
xlab = "Hora",
# las mañanas la hora en que en promedio se hace mayor uso del sistema es las 8,
#uso del sistema es a las 8 am idependientemente que sea usuario registrado u ocacional
#ya que para los usuarios registrados si se cumple el mayor uso, pero para los usuarios
#ocacionales no.
# hora pico del sistema para los usuarios ocasionales, considerando como indicador el
percentil 75.
boxplot(datos$casual~datos$hr,
xlab = "Hora",
quantile(datos$casual, 0.75)
boxplot(datos$hr~datos$casual,)
#la hora pico del sistema seria a las 12pm ya que es cuando en una misma hora se concetra
# especificamente el P75
boxplot(Hora$casual~Hora$season,
xlab = "estaciones",
mybox<- boxplot(Hora$casual~Hora$season,
xlab = "estaciones",
#------------------------------------------------------------------------------
install.packages("curl")
library(curl)
library(haven)
salud.personal = read_sav("http://portal.susalud.gob.pe/wp-content/uploads/archivo/base-
de-datos/2015/CUESTIONARIO%2002%20-%20CAPITULOS.sav")
salud.medicos = salud.personal[salud.personal$C2P1 == 1 , ]
salud.medicos = as_factor(salud.medicos)
View(salud.medicos)
# especialidad (C2P13).
salud.medicos$C2P28
salud.medicos$C2P13
table(salud.medicos$C2P13,salud.medicos$C2P28)
prop.table(table(salud.medicos$C2P13,salud.medicos$C2P28))
barplot(prop.table(table(salud.medicos$C2P13,salud.medicos$C2P28)),
beside = T,
col=1:2)
#Los que si tiene una especialidad tieneden a ganar más en el rango de 4001 a 5000
prop.table(table(salud.medicos$C2P13,salud.medicos$C2P28),1)
prop.table(table(salud.medicos$C2P13,salud.medicos$C2P28),2)
#FALSO, DENTRO DEL RANGO 4001 y 5000 soles, LOS QUE SI TIENEN ESPECIALIDAD
prop.table(table(salud.medicos$C2P13,salud.medicos$C2P28))
#FALSO, la proporción de médicos con ingresos menores o iguales a 3000 soles da un total de
0.0617