Está en la página 1de 11

Proyecto

Análisis exploratorio de datos

Licenciatura en Actuaría

Grupo A6

Materia: Estadistica Matematica


Introducción
La movilidad estudiantil es un componente esencial en la experiencia universitaria,
ya que influye en el tiempo y recursos que los estudiantes destinan para trasladarse
desde sus hogares hasta las instituciones educativas. En este análisis sobre
movilidad y ubicación geográfica, se busca profundizar en este fenómeno mediante
el examen de datos recolectados acerca de los hábitos de desplazamiento de los
estudiantes.

¿Por que es importante la movilidad estudiantil?

La movilidad puede afectar el rendimiento académico, ya que los largos tiempos de


desplazamiento pueden generar fatiga y estrés, lo que impacta negativamente en la
concentración y el aprendizaje. La movilidad puede actuar como una barrera para la
inclusión y diversidad, especialmente para estudiantes de zonas rurales o con bajos
recursos económicos.

Las universidades pueden implementar políticas de apoyo, como becas de


transporte, subsidios para el uso del transporte público o programas de carpooling
también el fomentar la creación de infraestructura adecuada, como la construcción
de ciclovías, rutas de transporte público eficientes o campus universitarios más
accesibles.
Descripción técnica de datos

Los datos que podemos encontrar del tipo cadenas de texto los
podemos encontrar en columnas como:
● Calle, número, colonia, municipio, estado, código postal.
● ¿Cómo te identificas?
● Dirección que tenías mientras estudiabas la preparatoria (Calle,
número, colonia, municipio, estado, código postal).
● ¿Para llegar a la universidad qué tipo de transporte utilizas?
● ¿Cuánto tiempo destinas diariamente para trasladarte de tu
casa a la universidad?
● ¿Cuál es tu medio de transporte para llegar a la institución?
(puedes seleccionar más de una opción)
● Al elegir tu medio de transporte, ¿Tomas en cuenta alguno de
los siguientes factores? (Puedes elegir más de uno
● Aprovecha tu tiempo para realizar alguna de las siguientes
actividades. (Puedes seleccionar más de una).
● De no regresar directamente a casa, ¿Qué tipo de actividad
realizas?
● Podrías proporcionar la dirección del lugar hacia donde te
diriges después de la universidad (Calle, número, colonia,
municipio, estado, código postal).
● ¿Qué carrera estás cursando actualmente?
● Seleccione el periodo escolar en que ingresó a la licenciatura
● ¿En qué situación te encuentras? De acuerdo con control
escolar
● En caso de no vivir con tu familia para asistir a la universidad
(ser foráneo), ¿Consideras que esto ha afectado a tu
desempeño académico?
● Debido al tiempo de traslado, ¿Se ven afectados los siguientes
hábitos?

Tenemos datos del tipo fechas y horas que se encuentran en las


columnas:
● Marca Temporal

Hay columnas con datos del tipo números enteros como:


● En ocasiones, al no acreditar una calificación ordinaria,
extraordinaria o ETS el sistema de control escolar te asigna
una R, ¿Cuántas R's acumulas actualmente?
Gráficos

Variable Numérica
# Crear el gráfico
plot(Encuesta_movilidad$Gasto.de.transporte, # Datos de la variable
numérica del conjunto de datos
type = "p", # Tipo de gráfico ("p" para puntos)
col = "green", # Color de los puntos
xlab = "Estudiantes", # Etiquetamos el eje x
ylab = "Gastos promedios", # Etiquetamos el eje y
main = "Gasto promedio de transporte de los estudiantes") # Título del
gráfico

El costo promedio de transporte para estudiantes varía, pero generalmente se


encuentra entre $100 y $500. Existe una correlación positiva entre el número
de estudiantes y el costo promedio de transporte. Esto podría deberse a que, a
medida que aumenta el número de estudiantes, también aumenta la demanda de
transporte, lo que puede hacer que los precios suban.
Variable Categórica
# Datos completos
transporte <- c(
"Ninguno (Llego caminando)", "Público", "Público", "Público", "Público", "Ambos",
# Convertir los datos a factor
transporte_factor <- factor(transporte)

# Generar el gráfico
library(ggplot2)
ggplot(data.frame(transporte = transporte_factor), aes(x = transporte)) +
geom_bar(fill = rev(heat.colors(length(levels(transporte_factor)))), width =
0.7) +
labs(title = "Tipo de transporte utilizado para llegar a la universidad",
x = "Tipo de transporte",
y = "Tipo de transporte que mas usan") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))

En esta gráfica lo que analizamos es que el transporte público juega un papel


importante en la movilidad de los estudiantes universitarios, también de este uso
del transporte público se deduce que la mayoría de los estudiantes no viven
cerca de la universidad, por eso es mayor el uso de este. Es importante que las
universidades consideren estas preferencias al planificar sus estrategias de
transporte y movilidad.

Dos Variables Numericas

plot(Encuesta_movilidad$Numero.de.reprobadas, # Datos para el eje x


Encuesta_movilidad$Promedio.general, # Datos para el eje y
col = "pink", # Color de los puntos
pch = 16, # Tipo de punto
xlab = "Numero de reprobadas", # Etiqueta del eje x
ylab = "Promedio general", # Etiqueta del eje y
main = "Relacion del promedio con el numero de R´s") # Título del gráfico

En el grafico se puede observar que hay una tendencia de promedios (eje y),
donde la mayoria de los promedios se encuentra encuentra mayormente en el
promedio de entre 80 y 100 y estos promedios se dividen en tres frecuencias de
materias reprobadas, la mayora de R´s se encuentra entre 0 y 5 y tambien entre
5 y 10 R´s, pero casi nadie se encuentra con mas de 10 R´s por lo que se deduce
que la mayoría de alumnos no tiene un mal promedio (opinión personal) pero eso le
a costado un poco de sacrificio al reprobar materias.

Dos variables categóricas


# Carga la biblioteca ggplot2
library(ggplot2)

# Crea un data frame con los datos proporcionados


data <- data.frame(
Situacion = c("Sin riesgo", "Riesgo Bajo", "Riesgo Medio", "Riesgo Alto"),
No = c(89, 38, 22, 38),
Si = c(34, 22, 17, 26)
)

# Dibuja el gráfico de barras


ggplot(data, aes(x = Situacion)) +
geom_bar(aes(y = No, fill = "No"), stat = "identity", position = "dodge") +
geom_bar(aes(y = Si, fill = "Sí"), stat = "identity", position = "dodge") +
scale_fill_manual(values = c("No" = "orange", "Sí" = "green")) +
labs(title = "Respuesta a la pregunta sobre desempeño vs. Situación de riesgo
escolar",
y = "Cantidad de respuestas",
fill = "Desempeño afectado por horas de traslado",
caption = "Datos proporcionados por el usuario") +
theme_minimal()
La situación de riesgo escolar emerge como un factor crucial que repercute
directamente en el rendimiento académico de los estudiantes. Aquellos que se
encuentran en este contexto demandan un respaldo adicional para desplegar su
máximo potencial. Es imperativo que las escuelas no solo reconozcan esta
realidad, sino que también implementen estrategias efectivas para identificar y
brindar el apoyo necesario a estos estudiantes en situación de riesgo. Su éxito
académico y personal depende en gran medida de la atención y el compromiso que
la comunidad escolar pueda ofrecerles.

Tres Variables o más


library(ggplot2)

# Crea un data frame con los datos proporcionados


data <- data.frame(
Afectado = c("Alimenticios", "Recreativos", "Gustos personales"),
No = c(65, 24, 13),
Si = c(129, 27, 39)
)

# Dibuja el gráfico de barras apiladas


ggplot(data, aes(x = Afectado, y = No + Si, fill = Afectado)) +
geom_bar(stat = "identity", position = "stack") +
geom_text(aes(label = No + Si), vjust = -0.5) +
scale_fill_manual(values = c("skyblue", "pink", "green")) + # Se agregó un
tercer color
labs(title = "Factores afectados por ser foráneo y su relación con el desempeño
académico",
y = "Cantidad de respuestas",
fill = "Afectado por ser foráneo",
caption = "Datos proporcionados por el usuario") +
theme_minimal()

Los factores que influyen en un mayor número de estudiantes ejercen un impacto


significativo en la disminución de la absorción. Es crucial identificar estos
factores que inciden en la absorción y adoptar medidas efectivas para
contrarrestar su impacto negativo. Sin embargo, se requiere una mayor
investigación para profundizar en la comprensión de la relación entre el número
de estudiantes afectados y la disminución de la absorción. Estos esfuerzos
investigativos son fundamentales para desarrollar estrategias más precisas y
efectivas que promuevan un entorno educativo óptimo para todos los
estudiantes.
Conclusiones
La conclusión general de este texto es que existen varios factores que influyen
en el desempeño académico y la experiencia educativa de los estudiantes, desde
la situación de riesgo escolar hasta la accesibilidad al transporte y el nivel
académico de la institución. Es esencial que las escuelas y universidades
reconozcan estas realidades y tomen medidas para abordarlas de manera
efectiva, ya sea mediante la implementación de estrategias de apoyo para
estudiantes en riesgo, la consideración de la logística del transporte público para
mejorar la movilidad estudiantil, o la valoración del nivel académico actual para
comprender mejor las necesidades de los alumnos. La atención a estos aspectos
contribuirá a crear un entorno educativo más inclusivo, equitativo y propicio para
el éxito de todos los estudiantes.

Referencias

Wickham, H. (2023). Mine Çetinkaya-Rundel, Garrett Grolemund - R for

Data Science_ Import, Tidy, Transform, Visualize, and Model

Data-O’Reilly Media.

Vega, J. B. M. (s/f). R para principiantes. Bookdown.org. Recuperado el 16

de marzo de 2024, de

https://bookdown.org/jboscomendoza/r-principiantes4/coercion.ht

ml

También podría gustarte