Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Zulmary Carrillo
2023-08-21
1. Introducció n
Descargamos las librerias que vamos a utilizar
library(dplyr)
##
## Attaching package: 'dplyr'
##
## Attaching package: 'moments'
2. Data Frame
3. Medidas de Tendencia Central
Hallar la media, media y moda de las calificaciones del tercer paracial. Interprete sus
respuestas.
r P3 <- as.numeric(datosCompleto$P3) x<-P3
a. La media se calcula de la siguiente manera:
r mean(x) #A) Media aritmética
## [1] 3.25125 Interpretació n: La media no se interpreta.
b. La mediana se puede obtener de dos maneras:
r median(x) #B) Mediana
## [1] 3.3
r quantile(x, probs=0.5) #C) Mediana o Segundo cuartil
2. Data Frame
## 50% ## 3.3 El valor de la mediana fue de 3.3.
Interpretació n: El 50% de los estudiantes obtuvo una nota en el tercer parcial menor o
igual que 3.3.
c. La moda
r mfv(x) #D) Moda con la librería "modeest"
## [1] 5 El valor de la moda fue de 5.0
Interpretació n: La nota má s frecuente fue de 5.0.
4. Medidas de dispersió n o de variabilidad
Calcule la varianza, la desviació n está ndar y el coeficiente de variació n. Interprete sus
respuestas.
a. Varianza
var(x) #A) Varianza muestral
## [1] 0.9786952
## [1] 0.9892902
## [1] 0.9892902
## [1] 30.428
## 5%
## 1.5
## 20%
## 2.4
## 40% 70%
## 3.0 3.8
## 25%
## 2.575
## 50%
## 3.3
## 75%
## 4
median(x [which (x <= median (x))]) #H) Primer cuartil. Compare con (E)
## [1] 2.7
median (x [which (x > median (x))]) #I) Tercer cuartil. Compare con (G)
## [1] 4
Observamos que P5=1.5, P20=2.4, P40=3.0, P70=3.8, Q1=2.575, Q2=3.3 (coincide con la
mediana), Q3=4.0, P0=1.0 (coincide con el dato menor), P100=5.0 (coincide con el dato
mayor).
b. Para el aná lisis exploratorio, se pueden utilizar las siguientes funciones, entre las
cuales, se encuentran los valores mínimos, má ximos y el rango intercuartil:
IQR(x) #J). Rango intercuartílico
## [1] 1.425
6. Medidas de Forma
Calcule el sesgo y la curtosis de las notas del tercer parcial. Interprete los resultados
obtenidos.
a. El sesgo y la curtosis se hallan de la librería “moments”.
skewness(x) #A) Sesgo
## [1] -0.1090939
## [1] 2.38379
## Privado Publico
## 3.252577 3.250000
## [1] 3.252577
b) El promedio de las notas del tercer examen en los colegios pú blicos fue:
datosCompleto%>% filter(Colegio=="Publico")->Privados #A) Grupo de los
colegios publicos
P3pr <- as.numeric(Privados$P3) #B) Parcial 3 dentro
de colegios públicos
mean(P3pr) #C) Media de P3 en
los colegios públicos
## [1] 3.25
## Femenino Masculino
## 3.204717 3.310227
b) Supongamos que nuestro grupo de interés son los colegios pú blicos. La media de las
notas del tercer paracial obtenidas por los hombres y las mujeres se obtienen así:
datosCompleto%>% filter(Colegio=="Publico")->Privados #A) Grupo los
colegios privados
P3pr <- as.numeric(Privados$P3) #B) Parcial 3 dentro
de colegios privados
tapply(P3pr, Privados$Sexo, mean) #C) En Privados:
Media de P3 en masculino y femenino
## Femenino Masculino
## 3.29619 3.20198
Insertando imagen
9.2. Segunda forma
*Ejemplo Otra forma de hallar la nota promedio de P3 (considerando la situació n anterior)
es como se muestra a continuació n (se le han agregado otras medidas a manera de
ejemplo):
datosCompleto %>% filter(Colegio=="Privado") %>% group_by(Sexo) %>%
summarise(n = length(as.numeric(P3)),
Promedio = mean(as.numeric(P3)),
Desviacion = sd(as.numeric(P3)),
Minimo = min(as.numeric(P3)),
Maximo = max(as.numeric(P3)))
## # A tibble: 2 × 6
## Sexo n Promedio Desviacion Minimo Maximo
## <chr> <int> <dbl> <dbl> <dbl> <dbl>
## 1 Femenino 106 3.20 0.964 1 5
## 2 Masculino 88 3.31 0.907 1 5