Está en la página 1de 4

Modelo de Regresión Logística Múltiple: Prueba Ser

Estudiante 2018 -2019 de la Zona 1 de Ecuador


Por: Mario Orlando Suárez Ibujés
Fecha: 25/10/2023
https://orcid.org/0000-0002-3962-5433
https://scholar.google.com/citations?user=FUoyU1cAAAAJ&hl=e
http://repositorio.utn.edu.ec/handle/123456789/760

Resumen

El modelo de regresión logística múltiple permite estimar la probabilidad de una variable cualitativa binaria
en función de predictores tanto continuos como categóricos, es decir, permite calcular la probabilidad de
que la variable dependiente pertenezca a cada una de las dos categorías en función del valor que adquieren
las variables independientes o predictores (Amat, 2016).Se aplica este modelo en la base de datos de la
Prueba Ser Estudiante 2018-2019 de estudiantes de la Zona 1 de Ecuador empleando

el software R. ellas la zona de residencia rural o urbana (Pozo


et al., 2022).
1. Introducción
También, el rendimiento académico es un tema
La Constitución de la República del Ecuador, muy controvertido en las instituciones
en su artículo 26, establece que la educación educativas debido a que este termina
es un derecho de las personas a lo largo de su determinando la calidad de la educación que
vida y un deber ineludible e inexcusable del reciben los estudiantes (Pérez y Romero,
Estado. Constituye un área prioritaria de la 2018). Algunos autores consideran que la más
política pública y de la inversión estatal, importante aptitud predictora del rendimiento
garantía de la igualdad e inclusión social y académico, mediante regresión múltiple, es la
condición indispensable para el buen vivir. Las verbal, seguida de la aptitud numérica (García
personas, las familias y la sociedad tienen el et al., 2000), encontrando diferencias entre las
derecho y la responsabilidad de participar en el escuelas ubicadas en áreas urbanas y las de
proceso educativo. Sin embargo, en las zonas áreas rurales, mostrando niveles más altos de
rurales del Ecuador, estas necesidades percepción de las matemáticas (Meza et al.,
educativas no han sido atendidas, las políticas 2021). Diversos trabajos de investigación
públicas no llegan de la forma esperada, los contribuyen al conocimiento sobre el uso de la
estudiantes y docentes luchan en medio de regresión lineal simple y múltiple para la
situaciones adversas para mejorar el educación mediante el establecimiento de
rendimiento académico, lo cual ha ocasionado modelos adecuados para analizar la relación
que los resultados de aprendizaje no sean los entre diversas variables como los resultados de
que el sector rural aspira (Garofalo, 2017). diferentes materias (Aliu et al., 2021).
Además, en las pruebas Ser Estudiante, que es
un proyecto de evaluación que obtiene En este contexto, surge la presente
información de los logros en el aprendizaje de investigación que estuvo encaminada a
los estudiantes establecidos en los estándares investigar sobre la posible relación entre el
de calidad educativa desarrollados por el hecho de que un estudiante perteneciente a un
Ministerio de Educación en 4to, 7mo y 10mo tipo de área (1=Rural, 2=Urbano) con el tipo de
año de Educación General Básica, así como en sexo (Mujer, Hombre) y las notas que obtiene
3ro de Bachillerato General Unificado en los en la Prueba Ser Estudiante 2018-2019 de
campos de Matemática, Lengua y Literatura, instituciones educativas pertenecientes a la
Ciencias Naturales y Estudios Sociales, los Coordinación Zonal 1-Educación. Por lo que se
estudiantes de las instituciones del área rural planteó un modelo de regresión logística
obtienen en promedio resultados más bajos múltiple con todas las variables y a partir del
que aquellos estudiantes de las instituciones mismo se obtuvo un modelo logístico múltiple
educativas ubicadas en el área urbana con las variables significativas. Con el modelo
(INEVAL, 2016). También, investigaciones han final se pudo verificar que el área a la que
asociado el rendimiento académico con pertenece el estudiantado influye en los
variables de carácter socioeconómico, entre resultados que obtienen los estudiantes, en

1
especial en el campo de Matemática y en el el modelo en su conjunto, así como los
campo Lengua y Literatura. predictores que lo forman.

2. Materiales y métodos
Base de datos
Se empleó la base de datos de la Prueba Ser 3. Resultados
Estudiante de las instituciones educativas
pertenecientes a la Coordinación Zonal Al usar el modelo de regresión logística
1Educación (Imbabura, Carchi, Esmeraldas y múltiple, la variable dependiente de área (rural
Sucumbíos) correspondiente al año lectivo y urbana), frente a las variables explicativas
2018-2019. La base de datos contiene 4580 cuyos valores son discretos en todos los casos
observaciones (2517 del área urbana y 2063 excepto en el sexo, toma como intercepto a los
del área rural) que corresponden al número de estimadores respecto a los hombres, ya que la
estudiantes evaluados y 6 variables: tipo de variable explicativa está utilizando el sexo
área (tp_area: 1=Rural, 2=Urbano), tipo de femenino.
sexo (tp_sexo: Mujer, Hombre), promedio
obtenido en el campo de Matemática (imat), El modelo completo (Tabla 2) identifica a icn,
promedio obtenido en el campo de Lengua y ies y tp-sexo mujer como no significativas, con
Literatura (ilyl), promedio obtenido en el campo un AIC de 6274.9. La ratio da más ventaja a las
de Ciencias Naturales (icn) y promedio variables explicativas sexo mujer (1.11), icn,
obtenido en el campo de Estudios Sociales ies e imat (1 en cada caso) a favor de la
(ies). variable Y y el resto lo contrario.
Tabla 2. Modelo completo
Tabla 1. Tabla de frecuencias Probabilidad (>|Z|)

tipo de sexo Area 3.37e-07 ***


tipo de área Hombre Mujer Sum Matemática 1.15e-05 ***
0 1316 1201 2517 (imat)
1 1030 1033 2063 Lengua y 0.000877 ***
Sum 2346 2234 4580 literatura
(ilyl)
Ciencias 0.422721
naturales
Planteamiento del Modelo (icn)
Estudios 0.451032
El modelo de regresión logística múltiple es una sociales (ies)
extensión de la regresión logística simple que
permite estimar la probabilidad de una variable Sexo 0.083254
cualitativa binaria en función de predictores femenino
tanto continuos como categóricos. Con la En el modelo reducido (Tabla ), las variables
regresión logística múltiple se calcula la explicativas imat y ilyl, muestran significancia,
probabilidad de que la variable dependiente con un AIC de 6274.3. Por tanto, las variables
pertenezca a cada una de las dos categorías mencionadas son las que brindan mayor
en función del valor que adquieren las variables explicación al modelo en área urbana. Acorde
independientes o predictores (Amat, 2016) a los p-values mostrados en el summary, La
contribución del modelo reducido es
𝑝
significativa a ambos predictores (Matemática
y Lengua y Literatura).
𝑙𝑛 𝛽𝑖𝑥𝑖

𝑙𝑜𝑔𝑖𝑡(𝑌) = 𝛽0 + 𝛽1𝑥1 +𝛽2𝑥2 + ⋯+ 𝛽𝑖𝑥𝑖

El valor de la probabilidad de Y se puede


obtener con la inversa del logaritmo natural
𝑒𝛽0+𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑖𝑥𝑖 𝑝(𝑌) Tabla 3. Modelo reducido
= 1+ 𝑒𝛽0+𝛽1𝑥1+𝛽2𝑥2+⋯+𝛽𝑖𝑥𝑖 Probabilidad (>|Z|)
Para evaluar la validez y calidad de un modelo
de regresión logística múltiple se analiza tanto Area 2.35e-06 ***

2
Matemática 1.36e-08 *** El modelo reducido es significativo y es capaz
(imat) de clasificar correctamente el 55,72% de las
Lengua y 0.00347 ** observaciones.
literatura
El área a la que pertenece el estudiantado de
(ilyl)
la Zona 1 de Ecuador influye en los resultados
Al comparar los modelos realizados, mediante que obtienen los estudiantes en el campo de
el análisis de varianza de los residuos la Matemática y en el campo Lengua y Literatura.
probabilidad ji-cuadrado de 0.1459, demuestra
que los modelo son iguales. De acuerdo con el
principio de parsimonia, elegir el modelo más
sencillo es lo más acorde para realizar
inferencia, en la variable dependiente.
Referencias
Aliu, A., Rexhepi, S., & Iseni, E. (2021).
Además, debido a que el p-value =
1.641048e08, el modelo reducido sí es Analysis and comparison
significativo
of
También, el modelo reducido es capaz de
clasificar correctamente commitment, homework, extra hours,
(2248+303)/(2249+300+1760+269)= 0,5572=
55,72 % de las preliminary grades and testing of
observaciones de entrenamiento como se
muestra en la Tabla 4 y Figura 1 students in Mathematics using linear

Tabla 4. Predicciones modelo reducido regression model. 13(3), 32.

predicciones Amat, R. (2016). Regresión logística simple y


observaciones 0 1
0 2248 269 múltiple.
1 1760 303
https://rpubs.com/Joaquin_AR/22973

Figura 1. Predicciones modelo reducido García, M., Alvarado, J., & Jiménez, A. (2000).

La predicción del

rendimiento académico: Regresión

lineal versus regresión logística.

Psicothema, 5.

Garofalo, R y Villacrés, F. (2018). Crisis de la

escuela rural, una realidad silenciosa

y su lucha para seguir adelante.

Revista Conrado, 14(62), 152-157.

Recuperado de

http://scielo.sld.cu/pdf/rc/v14n62/rc26
4. Conclusiones
Se generaron dos modelos logísticos, los 6218.pdf
cuales al ser comparados mediante el análisis
de varianza de los residuos la probabilidad Hossain, S. J., Tofail, F., Sujan, H. M.,
jicuadrado fueron iguales, por lo que.
empleando el principio de parsimonia se elige Arifeen, S. E., & Hamadani, J. (2021).
el modelo reducido como el más adecuado.
Factors associated with school

3
achievement of children aged 8–10 de Conocimientos, Saberes y

years in rural Bangladesh: Findings Prácticas, 1(2), 33-42.

from a post hoc analysis of a https://doi.org/10.30698/recsp.v1i2.1

community-based study. PLOS ONE, 0

16(7), e0254693. Pozo Burgos, E. J., Burbano Pulles, M. R.,

https://doi.org/10.1371/journal.pone.0 Vidal Chica, J. I., & Revelo Salgado, G.

254693 E. (2022). Sociocultural and

INEVAL, (2016). Retos educativos, retos hacia demographic factors that influence

la excelencia. academic performance: The

file:///C:/Users/Usuario1/Desktop/Ma preuniversity case of the Universidad

estr%C3%ADa/M%C3%B3dulo%203 Politécnica Estatal del Carchi. Journal

%20Modelos%20lineales/CIE_Result of Technology and Science Education,

adosEducativos- 12(1), 147.

RetosExcelencia201611301.pdf https://doi.org/10.3926/jotse.1359

Meza-Cascante, L. G., Suárez-Valdés-Ayala,

Z., Agüero-Calvo, E.,

JiménezCéspedes, R., Calderón-

Ferrey, M., Sancho-Martínez, L.,

Pérez-Tyteca, P., & Monje-Parrilla, J.

(2021). La matemática como dominio

masculino: Un estudio de la

percepción en la educación media

costarricense.

Revista Electrónica Educare, 25(3), 1-

15. https://doi.org/10.15359/ree.25-

3.35

Pérez Obregón, J. M., & Romero Díaz, T.

(2018). Análisis del

rendimiento académico mediante

regresión logística y

múltiple. Revista Electrónica

También podría gustarte