Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
Resumen : El artículo presenta un modelo de Red Neuronal para modelar el perfil académico de los estudiantes. El
modelo propuesto permite predecir el rendimiento académico de los estudiantes a partir de algunas de sus
observaciones cualitativas. Clasificar y predecir el rendimiento académico de los estudiantes utilizando técnicas
aritméticas y estadísticas puede no ofrecer necesariamente la mejor manera de evaluar la adquisición humana de
conocimientos y habilidades, pero un modelo de red neuronal difusa hibridada maneja con éxito el razonamiento
con información imprecisa, y permite representar el modelado de los estudiantes de forma lingüística - de la misma
manera que lo hacen los profesores humanos. El modelo se ha diseñado, desarrollado y probado en MATLAB y JAVA,
y tiene en cuenta factores como la edad, el sexo, la educación, el rendimiento anterior, la situación laboral, el entorno
de estudio, etc. para predecir el rendimiento de los estudiantes.
Se ha propuesto un modelo de red neuronal probabilística difusa que permite diseñar un componente de predicción
del rendimiento de los estudiantes personalizado y fácil de usar. Los resultados de los experimentos muestran que el
modelo supera a las redes neuronales de retropropagación tradicionales y a los modelos estadísticos. También se
ha comprobado que es una herramienta útil para predecir el rendimiento de los estudiantes de cualquier curso. El
modelo puede ofrecer una doble ventaja a las instituciones educativas: en primer lugar, ayuda a los profesores a
modificar su metodología de enseñanza en función del nivel de los alumnos, mejorando así su rendimiento, y, en segundo
lugar, clasifica a los alumnos que probablemente tengan éxito y a los que no.
Palabras clave : Educación, Fuzziness, Predicción, Retención, Rendimiento Académico Estudiantil, Red Neuronal
Probabilística
I. I NTRODUCCIÓN
A lo largo de los años, los investigadores han propuesto diversos métodos para predecir el rendimiento académico de
los estudiantes. El acto de asignar un mérito o valor cualitativo o cuantitativo a los logros de los estudiantes se define
como evaluación académica. Cuando la evaluación se realiza antes de que los estudiantes rindan realmente en
el plan de estudios, se denomina predicción del rendimiento. Una predicción temprana del rendimiento académico
de los estudiantes es una práctica importante por muchas razones: para obtener una idea del nivel de aprendizaje
de los estudiantes, para obtener información sobre el nivel de enseñanza, para decidir sobre el éxito o el fracaso
de los estudiantes en el curso matriculado, para informar a los estudiantes de bajo rendimiento para que se esfuercen
más en el curso para superar sus puntos débiles. Aumentar la retención o persistencia de los estudiantes es un
objetivo a largo plazo de todos los institutos académicos. Normalmente, los estudiantes de primer año son los que
corren mayor riesgo de abandonar los estudios. La experiencia temprana de los estudiantes en la satisfacción con el
curso desempeña un papel importante a la hora de mantener un alto índice de retención. Uno de los objetivos
intrínsecos del modelo es retener a los estudiantes en el curso averiguando el efecto de las actividades familiares, las
actividades laborales y el entorno del aula en su rendimiento. Hay dos factores que influyen directamente en el
rendimiento de los estudiantes: la aptitud de los estudiantes y la cantidad de esfuerzo que los estudiantes dedican al
curso. Se indica que la cantidad de esfuerzo realizado por un estudiante depende de su historial de calificaciones, su
motivación, sus actividades extraescolares, sus responsabilidades laborales y familiares [42].
Los distintos centros educativos tienen en cuenta diversos factores a la hora de admitir a los estudiantes. Algunos
institutos tienen en cuenta la capacidad cognitiva y las medidas de personalidad, mientras que otros admiten por
méritos, que básicamente son los resultados de la última clase que ha cursado el alumno. Pero esto puede no dar a los
profesores una idea correcta sobre el nivel de la masa a la que se van a dirigir. Si mantienen un alto nivel de
instrucción, es posible que los alumnos no sean capaces de captar lo que se enseña en clase. Por otra parte, si el nivel
de la enseñanza se mantiene razonablemente bajo, es posible que los alumnos no se tomen en serio la asignatura o
que ésta degrade la eficacia del profesor. De ahí que el instituto se proponga evaluar y predecir el rendimiento
académico de los alumnos para determinar qué porcentaje de estudiantes pertenece a la categoría de inteligentes,
medios o malos. Al principio del curso, los profesores necesitan conocer los niveles de sus alumnos, lo que puede
proporcionarles una pauta para decidir cuánto esfuerzo tienen que poner mientras enseñan en el aula. Esto también
puede orientarles a rebajar o a elevar su nivel de enseñanza en el aula para impartir los conocimientos adecuados
para un progreso académico satisfactorio.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
teoría de la probabilidad.
Se sabe que los sistemas de puntuación Fuzzy Expert [26] ayudan a los profesores a realizar evaluaciones en menos
tiempo y con un nivel de precisión que se compara favorablemente con el del mejor examinador. El modelo de Tinto
[38] es el marco teórico predominante para considerar los factores del éxito académico. Consideró el proceso de
abandono estudiantil como una interacción sociopsicológica entre las características del estudiante que entra en la
universidad y la experiencia en el instituto. Muchos estudios incluyeron una amplia gama de variables, como factores de
personalidad, pruebas de inteligencia y aptitud, rendimiento académico, logros universitarios previos, datos
demográficos, etc. [8], [14], [21] para evaluar el rendimiento académico de los estudiantes.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
Uno de los rasgos característicos de la PNN que más la favorece como opción de predicción es que nunca se atasca en
mínimos locales y las muestras de t raining pueden añadirse o eliminarse de la red sin necesidad de entrenamiento
adicional. Una PNN es una implementación de un algoritmo estadístico denominado análisis discriminante
de núcleo en el que las operaciones se organizan en una red de alimentación hacia delante multicapa. La PNN
se compone de muchas neuronas interconectadas organizadas en capas sucesivas. La red neuronal probabilística
difusa (FPNN) [6], como se muestra en la figura 1, es una estructura de cuatro capas que consta de capa de entrada,
capa de prototipo/patrón, capa de suma y capa de salida.
La capa de entrada recibe un vector n-dimensional x(k) para su clasificación. No realiza ningún cálculo y
simplemente distribuye la entrada a las neuronas de la capa siguiente. La primera capa oculta, denominada capa
prototipo, contiene neuronas idénticas al número de muestras de entrenamiento con las funciones de activación de
gbell y sus pesos sinápticos en las conexiones de entrada a prototipo están determinados por los componentes de los
patrones de entrenamiento, es decir
wji = xi ( j ) i = 1, 2,...n y 1 ≤ j ≤ M (1)
Donde, xi ( j ) denota la entrada del nodo ith de la muestra jth en la capa de entrada. Las neuronas de la capa prototipo
se dividen en m grupos con Nt nodos en cada uno, correspondientes a su cluster. El vector de pesos de la neurona pth
en tth grupo se denota por
wt , p = wt + p -1 t = 1, 2,...m y p = 1, 2,...Nt (2)
Cuando el vector x(k) se da como entrada a la red, la clasificación de los vectores de entrada se inicia calculando la
entrada neta a la capa de patrones de la siguiente manera:
2
nj[1] = x (k ) - w t,p (3)
Por consiguiente, las neuronas de esta capa realizan cálculos
[1] ⎞
o[1] (k ) = exp ⎜-nj 2⎟
⎛
t = 1, 2,...m y p = 1, 2,...N t (4)
t,p ⎜ 2σ ⎟
⎝ t⎠
La segunda capa oculta, denominada capa sumatoria, consta de m+1 nodos sumatorios elementales en los que cada
uno de los primeros m nodos representa una clase individual. Todos estos m nodos reciben las salidas de la capa
prototipo de forma que
Nt
2]
o[ (k ) = ∑vtto, p[1]t , (k ) (6)
p p =1
Donde, v l, p ≥ 1 es un peso sináptico de conexión prototipo-capa de suma utilizado para determinar la forma del cluster.
Estos pesos se inicializan a v l,p = 1 . El último nodo m+1th calcula la suma total
m Nt
2]
o[ (k ) = ∑∑v o[1] (k ) (7)
∑ t,pt,p
t =1 p =1
Cabe señalar que las sumas de la ecuación (6) son aproximaciones de Parzen de distribuciones de datos desconocidas
en los conglomerados. La última capa, denominada capa de normalización de la salida, está formada por m
divisores. Calcula el vector de grados de pertenencia y(k) como
[2]
0 ≤ y (k ) = ot (k ) ≤ 1 y ∑ y (k ) = (8)
1
m
∑2 t
t o[ ] (k ) t =1
determinada clase.
V. E XPERIMENTOS REALIZADOS
Las redes neuronales probabilísticas tradicionales resuelven los problemas de predicción/clasificación considerando las
entradas estándar crisp. En cambio, en los problemas reales, las entradas no pueden tener límites de separación
puros. El problema de los conglomerados superpuestos es común cuando se consideran los parámetros de entrada, ya
que pueden pertenecer a más de una clase simultáneamente con ciertos grados de pertenencia. Como ya se ha
indicado, se ha utilizado una PNN difusa para tratar este tipo de entradas en lugar de una PNN difusa.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
Se ha diseñado una red neuronal probabilística difusa (FPNN) utilizando MATLAB y se ha analizado en un conjunto
de datos de entrenamiento de 760 muestras que consta de más de 18 factores como entradas a la red. El conjunto de
entrenamiento de la FPNN está formado por un conjunto de
vector que comprende todos los los factores en x (1),
x (2),..., x ( j ) donde cada
T
x ( j ) = (x ( j ), x ( j ),...,x ( j )) El conjunto de datos disponible se valida de forma cruzada en una proporción
de 3:1 para dividirlo en
1 2 18
Para reducir el número de nodos ocultos y probar la red con un conjunto más pequeño de patrones ejemplares, se
dividió un conjunto de datos de 400 en dos subconjuntos utilizando el mismo procedimiento de validación cruzada, lo
que dio como resultado un conjunto de entrenamiento de 300 y un conjunto de prueba de 100 muestras. La figura 3
muestra el conjunto de datos utilizado para entrenar la FPNN, que se distribuye por igual entre las tres clases.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
La red neuronal se probó con distintos conjuntos de muestras de entrenamiento y prueba para controlar su
rendimiento. Tras considerar muchos valores posibles, el parámetro de suavizado se fijó en 0,1, ya que se
comprobó que minimizaba el error de clasificación .
La razón básica de los errores de clasificación se debe a la presencia de ruido en los datos de prueba. El
método de validación cruzada mejora la capacidad de generalización de la red. Se realizaron experimentos por
separado con y sin el método de validación cruzada para entrenar la FPNN.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
La red entrenada sin validación cruzada converge en 90 minutos aproximadamente, mientras que cuando se aplica el
método de validación cruzada, converge en 47 minutos, es decir, casi menos de la mitad de tiempo que una
red de retropropagación típica, que tarda unos 120 minutos en entrenarse. Esto indica que la convergencia
de la red se ve afectada significativamente por el uso de un método de validación cruzada.
R EFERENCIAS
[1] Adeli H. y Panakkat A., A probabilistic neural network for earthquake magnitude prediction, Neural Networks, nº 22, pp. 10 18-1024, 2009.
[2] Antons C.M. y Maltz E.N., Expanding the role of institutional research at small private universities: A case study in enrollment management
using data mining, New Directions for Institutional Research, Vol. 2006, No. 131, pp. 69-81, 2006.
[3] Bailey B.L., Let the data talk: Developing models to explain IPEDS graduation rates, New Directions for Institutional Researc h, nº 131, pp. 101-
11515, 2006.
[4] Bascil M.S. y Oztekin H., A study on hepatitis disease diagnosis u sing probabilistic neural network, Journal of Medical Systems, Vol. 36,
No. 3, pp. 1603-1606, 2012.
[5] Biswas R., An Application of Fuzzy Sets in Students' Evaluation, Fuzzy Sets and Systems, nº 74, pp. 187-194, 1995.
[6] Bodyanskiy Ye., Gorshkov Ye., Kolo dyazhniy V., Resource-Allocating Probabilistic Neuro -Fuzzy Network, In: Proceedings of International
Conference on Fuzzy Logic and Technology, Alemania, 2003.
[7] Chamorro-Premuzic T., y Furnham A., Personality, intelligence and approaches to learning as predictors of academic performance.
Personality and Individual Differences, nº 44, pp. 1596 -1603, 2008.
[8] Chang L., Applying data mining to predict college admissions yield: A case study, New Directions for Institutional Research, nº 131, 2006.
[9] Chen S.M. y Lee C.H., New Methods for Students' Evaluation Using Fuzzy Sets, Fuzzy Sets and Systems, nº 104, pp. 209 - 218, 1999.
[10] Chen C., Lee J. y Lin M., Classification of underwater signals using neural networks, Tamkang Journal of Science and Engin eering, Vol. 3, nº
1, pp. 31-48, 2000.
[11] Choi H. H., Robust stabilization of uncertain fuzzy -time-delay systems using sliding -mode-control approach, IEEE Transactions on Fuzzy
Systems, Vol. 18, No. 5, pp. 979-984, 2010.
[12] Chung T.Y., Chen Y. M. y Tang S. C., Expert Systems wi th Applications, A hybrid system integrating signal analysis and probabilistic
neural network for user motion detection in wireless networks, n.º 39, pp. 3392 -3403, 2012.
[13] Cowell R., Lauritzen S., Spiegelhater D. y David P., Probabilistic networks and ex pert systems. Nueva York, NY: Springer, 2003.
[14] Deniz D. Z., y Ersan I., An academic decision -support system based on academic performance evaluation for student and program
assessment, International Journal of Engineering Education, Vol. 18, No. 2, pp. 236-244, 2002.
[15] Ding B., Homogeneous polynomially nonquadratic stabilization of discrete -time Takagi-Sugeno systems via nonparallel distributed
compensation law, IEEE Transactions on Fuzzy Systems, Vol. 18, No. 5, pp. 994 -1000, 2010.
[16] Duda R.O., Pattern Classification 2nd Edition with Computer Manual, John Wiley and Sons Inc., USA , 2004.
[17] Fourali C., Fuzzy Logic and the Quality of Assessment of Portfolios, Fuzzy Sets and Systems, nº 68, pp. 123 - 139, 1994.
[18] Holmes E., Nicholson J., y Tranter G., Metabonomic characterization of genetic variations in toxicological and metabolic responses using
probabilistic neural networks. Chemical Research in Toxicology, Vol. 14, No. 2, pp. 182 -191, 2001.
Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)
BIOGRAFÍA
Nidhi Arora cuenta con más de 11 años de experiencia docente a nivel de posgrado. Está asociada a
muchas organizaciones técnicas y de investigación y es miembro activo del consejo de revisores
de revistas internacionales indias y extranjeras. Sus trabajos de investigación se publican en
revistas nacionales e internacionales como IEEE y Springer Verlag London Ltd. Sus áreas de
interés son la inteligencia artificial, la informática blanda, la simulación y el modelado, los
sistemas híbridos y los sistemas expertos y de apoyo a la toma de decisiones.
El Dr. Jatinderkumar R. Saini es Doctor por la VNSGU, Surat. Cuenta con la certificación IBM
Certified Database Associate (DB2) y IBM Certified Associate Developer (RAD). Ha participado en
casi 25 países y ha sido miembro del comité de programa de 40 conferencias internacionales
(incluidas las del IEEE) y miembro del consejo editorial o revisor de 25 revistas internacionales
(incluidas las que tienen factor de impacto). Ha publicado 33 artículos de investigación y
16 ponencias en prestigiosas conferencias y revistas nacionales e internacionales. Es miembro
de ISTE, IETE, ISG y CSI.
ISSN: 2319 -8753