Está en la página 1de 16

Suscríbete a DeepL Pro para poder traducir archivos de mayor tamaño.

ISSN: 2319 -8753


Más información disponible en www.DeepL.com/pro.

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013

Una red neuronal probabilística difusa para


predecir el rendimiento académico de los
estudiantes
Nidhi Arora 1, JatinderKumar R. Saini 2
Profesor adjunto, Departamento de M.C.A., Facultad de Ingeniería U.V. Patel, Universidad Ganpat,
Kherva, India 1
Profesor adjunto, Departamento de M.C.A., Narmada College of Computer Application, Bharuch,
Gujarat, India 2

Resumen : El artículo presenta un modelo de Red Neuronal para modelar el perfil académico de los estudiantes. El
modelo propuesto permite predecir el rendimiento académico de los estudiantes a partir de algunas de sus
observaciones cualitativas. Clasificar y predecir el rendimiento académico de los estudiantes utilizando técnicas
aritméticas y estadísticas puede no ofrecer necesariamente la mejor manera de evaluar la adquisición humana de
conocimientos y habilidades, pero un modelo de red neuronal difusa hibridada maneja con éxito el razonamiento
con información imprecisa, y permite representar el modelado de los estudiantes de forma lingüística - de la misma
manera que lo hacen los profesores humanos. El modelo se ha diseñado, desarrollado y probado en MATLAB y JAVA,
y tiene en cuenta factores como la edad, el sexo, la educación, el rendimiento anterior, la situación laboral, el entorno
de estudio, etc. para predecir el rendimiento de los estudiantes.
Se ha propuesto un modelo de red neuronal probabilística difusa que permite diseñar un componente de predicción
del rendimiento de los estudiantes personalizado y fácil de usar. Los resultados de los experimentos muestran que el
modelo supera a las redes neuronales de retropropagación tradicionales y a los modelos estadísticos. También se
ha comprobado que es una herramienta útil para predecir el rendimiento de los estudiantes de cualquier curso. El
modelo puede ofrecer una doble ventaja a las instituciones educativas: en primer lugar, ayuda a los profesores a
modificar su metodología de enseñanza en función del nivel de los alumnos, mejorando así su rendimiento, y, en segundo
lugar, clasifica a los alumnos que probablemente tengan éxito y a los que no.

Palabras clave : Educación, Fuzziness, Predicción, Retención, Rendimiento Académico Estudiantil, Red Neuronal
Probabilística

I. I NTRODUCCIÓN
A lo largo de los años, los investigadores han propuesto diversos métodos para predecir el rendimiento académico de
los estudiantes. El acto de asignar un mérito o valor cualitativo o cuantitativo a los logros de los estudiantes se define
como evaluación académica. Cuando la evaluación se realiza antes de que los estudiantes rindan realmente en
el plan de estudios, se denomina predicción del rendimiento. Una predicción temprana del rendimiento académico
de los estudiantes es una práctica importante por muchas razones: para obtener una idea del nivel de aprendizaje
de los estudiantes, para obtener información sobre el nivel de enseñanza, para decidir sobre el éxito o el fracaso
de los estudiantes en el curso matriculado, para informar a los estudiantes de bajo rendimiento para que se esfuercen
más en el curso para superar sus puntos débiles. Aumentar la retención o persistencia de los estudiantes es un
objetivo a largo plazo de todos los institutos académicos. Normalmente, los estudiantes de primer año son los que
corren mayor riesgo de abandonar los estudios. La experiencia temprana de los estudiantes en la satisfacción con el
curso desempeña un papel importante a la hora de mantener un alto índice de retención. Uno de los objetivos
intrínsecos del modelo es retener a los estudiantes en el curso averiguando el efecto de las actividades familiares, las

Derechos de autor de www.ijirset.com 4425


IJIRSET
ISSN: 2319 -8753

actividades laborales y el entorno del aula en su rendimiento. Hay dos factores que influyen directamente en el
rendimiento de los estudiantes: la aptitud de los estudiantes y la cantidad de esfuerzo que los estudiantes dedican al
curso. Se indica que la cantidad de esfuerzo realizado por un estudiante depende de su historial de calificaciones, su
motivación, sus actividades extraescolares, sus responsabilidades laborales y familiares [42].
Los distintos centros educativos tienen en cuenta diversos factores a la hora de admitir a los estudiantes. Algunos
institutos tienen en cuenta la capacidad cognitiva y las medidas de personalidad, mientras que otros admiten por
méritos, que básicamente son los resultados de la última clase que ha cursado el alumno. Pero esto puede no dar a los
profesores una idea correcta sobre el nivel de la masa a la que se van a dirigir. Si mantienen un alto nivel de
instrucción, es posible que los alumnos no sean capaces de captar lo que se enseña en clase. Por otra parte, si el nivel
de la enseñanza se mantiene razonablemente bajo, es posible que los alumnos no se tomen en serio la asignatura o
que ésta degrade la eficacia del profesor. De ahí que el instituto se proponga evaluar y predecir el rendimiento
académico de los alumnos para determinar qué porcentaje de estudiantes pertenece a la categoría de inteligentes,
medios o malos. Al principio del curso, los profesores necesitan conocer los niveles de sus alumnos, lo que puede
proporcionarles una pauta para decidir cuánto esfuerzo tienen que poner mientras enseñan en el aula. Esto también
puede orientarles a rebajar o a elevar su nivel de enseñanza en el aula para impartir los conocimientos adecuados
para un progreso académico satisfactorio.

Derechos de autor de www.ijirset.com 4426


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013


El modelo propone una Red Neuronal Probabilística hibridada con fuzzy lo gic para predecir el rendimiento de los
estudiantes y clasificarlos según sus características si milares. Las Redes Neuronales Probabilísticas (PNN) se han
utilizado ampliamente para problemas de reconocimiento de patrones, como el reconocimiento de texturas [ 32], el
reconocimiento de imágenes [ 24], el campo médico/bioquímico [41], el procesamiento de señales [ 10], la
ingeniería civil/geotécnica [ 34], etcétera. PNN puede predecir la estimación de la resistencia a la compresión
del hormigón sobre la base de las proporciones de la mezcla de hormigón; el rendimiento de estimación de PNN
se mejora mediante el método de iteración [21]. El resto del artículo se organiza como sigue: La sección 2 recoge
trabajos relacionados en el ámbito de la educación para predecir el rendimiento de los estudiantes con diversas
técnicas. La Sección 3 ofrece un resumen de la importancia de la predicción del rendimiento académico de los
estudiantes y la Sección 4 presenta una revisión de la arquitectura FPNN y las capacidades de clasificación. La Sección
5 ofrece una descripción general de los datos utilizados en el estudio, los pasos de preprocesamiento para analizar los
datos y los experimentos realizados. La Sección 7 resume los resultados de los experimentos y la Sección 7 concluye el
artículo con una perspectiva de trabajo futuro. Por último, en la Sección 8 se enumeran las referencias.

II. T RABAJO REMUNERADO


Varios investigadores han aplicado la minería de datos en distintos ámbitos de la educación, como la gestión de la
matriculación ([2], [21]), la graduación ([ 4], [30]) o el rendimiento académico ([ 23], [28], [35]). El uso de técnicas
de minería de datos en este campo es relativamente nuevo. Hay muchas técnicas de minería de datos utilizadas
en este campo, como las redes neuronales, el árbol de decisión, la red bayesiana, la agrupación k-means, etc. [ 31].
Los investigadores académicos han desarrollado varios modelos convencionales basados en estadísticas como el
análisis discriminante, la regresión múltiple y la regresión por pasos para predecir el éxito de un solicitante en el
programa MBA. En los métodos estadísticos utilizados hasta ahora en este ámbito, las distintas puntuaciones de cada
criterio de evaluación se suman en función de unos pesos predeterminados para calcular una única puntuación del
rendimiento de cada estudiante. Sin embargo, estos esquemas de predicción son deficientes en los mecanismos
formales que consideran algunos de los factores cognitivos para una predicción exacta del rendimiento del estudiante.
Estudio de un caso de minería de datos
[27] identificaron el comportamiento de los alumnos que suspendían para poder advertirles del riesgo que corrían antes
de los exámenes finales. En su estudio, Chamorro-Premusic & Furnham [7] llegaron a la conclusión de que la apertura
y la concienciación, junto con los enfoques medibles del aprendizaje, median los efectos entre la capacidad y el
rendimiento académico en los estudiantes universitarios, predominantemente mujeres. Según ellos, el género
también es uno de los factores moderadores que influyen en las relaciones entre los rasgos de personalidad y el
rendimiento académico. Todos los métodos estadísticos para evaluar o predecir el rendimiento académico de los
estudiantes han arrojado resultados satisfactorios, pero un aspecto común en el que fallan todos estos métodos
es que se enfrentan a un entorno que cambia dinámicamente y a la imprecisión de la realidad. Las redes neuronales
aportan adaptabilidad como solución al entorno dinámico, mientras que la hibridación de la lógica difusa con las redes
neuronales también puede hacer frente a la imprecisión.
En el pasado reciente, los modelos PNN han sido utilizados por [33] para distinguir pacientes con cáncer de personas
sanas según los niveles de nucleósidos en la orina humana y por [25] para el reconocimiento de dígitos
manuscritos. Para más información sobre otras aplicaciones motivadoras de la PNN , se remite al lector a [1], [4],
[12], [18] y [20]. El problema crucial en estas aplicaciones es la elección del parámetro de suavizado. Deniz & Ersan
[14] presentaron varias formas en las que los datos de rendimiento de los estudiantes pueden ser analizados y
presentados para un sistema de toma de decisiones académicas y de apoyo a la toma de decisiones académicas.
Lassibille & Gomez [23] presentaron un enfoque integrado de conjuntos difusos para evaluar los resultados del
aprendizaje de un estudiante. Explotaron los principios de los conjuntos difusos para representar los conceptos
imprecisos para el juicio objetivo y aplicaron un método de conjuntos difusos para determinar los criterios de
evaluación y sus pesos correspondientes. El razonamiento basado en enfoques difusos se ha aplicado con éxito
para la inferencia de atributos múltiples que contienen datos imprecisos. Biswas [5] propuso una aplicación de
conjuntos difusos a la evaluación académica de estudiantes. Las razones detrás del uso del enfoque difuso son que un
sistema de calificación educativa implica cantidades sustanciales de confusión y que la teoría difusa puede proporcionar
un modelo de juicios subjetivos. Chen y Lee [9] propusieron un método para la evaluación de los guiones de respuestas
de los estudiantes. El propósito de su estudio era contrarrestar algunos inconvenientes del método propuesto por
Biswas. El método propuesto por [9] es similar al de [17], que utiliza valores de funciones de pertenencia difusas y la

Derechos de autor de www.ijirset.com 4427


IJIRSET
ISSN: 2319 -8753

teoría de la probabilidad.
Se sabe que los sistemas de puntuación Fuzzy Expert [26] ayudan a los profesores a realizar evaluaciones en menos
tiempo y con un nivel de precisión que se compara favorablemente con el del mejor examinador. El modelo de Tinto
[38] es el marco teórico predominante para considerar los factores del éxito académico. Consideró el proceso de
abandono estudiantil como una interacción sociopsicológica entre las características del estudiante que entra en la
universidad y la experiencia en el instituto. Muchos estudios incluyeron una amplia gama de variables, como factores de
personalidad, pruebas de inteligencia y aptitud, rendimiento académico, logros universitarios previos, datos
demográficos, etc. [8], [14], [21] para evaluar el rendimiento académico de los estudiantes.

III. P REDICCIÓN DEL RENDIMIENTO ACADÉMICO


La predicción del rendimiento académico de los estudiantes implica la medición de la capacidad, la competencia y
las habilidades. La capacidad, la competencia y las aptitudes son conceptos difusos y pueden expresarse de forma
aproximada en términos difusos. Esto suele implicar

Derechos de autor de www.ijirset.com 4428


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013


Conceder méritos numéricos a los alumnos que representen sus logros mediante el razonamiento con
métodos aritméticos o estadísticos. En los métodos matemáticos se utilizan diversos criterios para la evaluación.
Por ejemplo, se suman distintas puntuaciones de cada criterio para obtener una única puntuación. También pueden
utilizarse métodos estadísticos simples, como el cálculo de la media, o complejos, como el cálculo de la media, la mediana,
la moda, el rango, la desviación típica, la varianza y la puntuación z estándar.
Se considera que los profesores son los observadores más responsables, que no sólo se ocupan de la clase, sino
que también vigilan el comportamiento y la comprensión de los alumnos. Prever su rendimiento puede influir en el
rendimiento de los alumnos. Los resultados de las predicciones pueden ser útiles para que los profesores equilibren sus
esfuerzos para mejorar el rendimiento de los alumnos. La red neuronal probabilística (PNN) es una red neuronal
de alimentación hacia delante, y su estructura es la implementación en red neuronal de la estimación no
paramétrica de la función de densidad de probabilidad (PDF) de Parzen y la regla de clasificación de Bayes [30]. La
PNN es una opción eficaz para los problemas de predicción porque necesita menos tiempo para determinar la
arquitectura de la red y para entrenarla. Además, la PNN proporciona puntos de vista probabilísticos, así como
resultados de clasificación determinísticos. Las FNN no requieren modelos matemáticos y tienen la capacidad de
aproximar sistemas no lineales e inciertos [11], [15], [18 ].

IV. R ED NEURONAL PROBABILÍSTICA F UZZY


La red neuronal probabilística, introducida por Donald Specht, es un algoritmo de entrenamiento de 4 capas, feed-
forward, de una sola pasada, utilizado para la clasificación y el mapeo de datos [ 35]. A diferencia de otras redes
neuronales artificiales, como la red de retropropagación, se basa en principios estadísticos bien establecidos
derivados de la estrategia de decisión de Bayes y en estimadores no paramétricos basados en núcleos de
funciones de densidad de probabilidad. Una red neuronal probabilística (PNN), que es un tipo de red de función
de base radial (RBF) [40], es predominantemente un clasificador que asigna cualquier patrón de entrada a una serie de
clases. Puede convertirse en un aproximador de funciones más general. Las redes neuronales
probabilísticas poseen la simplicidad, velocidad y transparencia de los modelos tradicionales de clasificación
estadística junto con gran parte de la potencia de cálculo y flexibilidad de las redes neuronales propagadas
hacia atrás [36]. Las PNN han demostrado ser más eficientes en tiempo que las redes convencionales
basadas en retropropagación y han sido reconocidas como una alternativa en problemas de clasificación en tiempo
real. Las redes neuronales tradicionales utilizan alguna regla de aprendizaje para inicializar y actualizar el valor
de los pesos de conexión entre varias capas y posteriormente entrenar la red. A diferencia de estas redes, no
se requiere ninguna regla de aprendizaje para entrenar una PNN y no se necesitan criterios de convergencia
predefinidos. El inconveniente de la PNN en problemas de predicción es que sólo puede utilizarse si la salida
deseada se expresa como una de varias clases predefinidas [13].
Las redes neuronales probabilísticas utilizan funciones de base radial como funciones de activación en la capa oculta
para crear una función de decisión local centrada en un subconjunto del espacio de entrada [39]. La función de decisión
global se construye sumando todas las funciones locales [16], [22] . Las PNNs son los mejores clasificadores
neuronales debido a su arquitectura de diseño [3]. Por esta razón, las PNN tienen ventaja sobre otras redes multicapa.
El problema de los mínimos locales no afecta a la decisión de una PNN. Cuando la cantidad de datos disponibles
es limitada y el tiempo asignado para la clasificación está limitado por algunas restricciones, las RNP representan
un enfoque excelente y fiable. Las PNN tienen varias ventajas sobre otras redes neuronales. El proceso de
entrenamiento de una PNN es órdenes de magnitud más rápido que la retropropagación [37]. Con una estructura
inherentemente paralela, la PNN garantiza la convergencia a un clasificador óptimo a medida que aumenta el
tamaño del conjunto de entrenamiento representativo.

Derechos de autor de www.ijirset.com 4429


IJIRSET
ISSN: 2319 -8753

Fig. 1 Arquitectura de la red neuronal probabilística difusa

Derechos de autor de www.ijirset.com 4430


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013

Uno de los rasgos característicos de la PNN que más la favorece como opción de predicción es que nunca se atasca en
mínimos locales y las muestras de t raining pueden añadirse o eliminarse de la red sin necesidad de entrenamiento
adicional. Una PNN es una implementación de un algoritmo estadístico denominado análisis discriminante
de núcleo en el que las operaciones se organizan en una red de alimentación hacia delante multicapa. La PNN
se compone de muchas neuronas interconectadas organizadas en capas sucesivas. La red neuronal probabilística
difusa (FPNN) [6], como se muestra en la figura 1, es una estructura de cuatro capas que consta de capa de entrada,
capa de prototipo/patrón, capa de suma y capa de salida.
La capa de entrada recibe un vector n-dimensional x(k) para su clasificación. No realiza ningún cálculo y
simplemente distribuye la entrada a las neuronas de la capa siguiente. La primera capa oculta, denominada capa
prototipo, contiene neuronas idénticas al número de muestras de entrenamiento con las funciones de activación de
gbell y sus pesos sinápticos en las conexiones de entrada a prototipo están determinados por los componentes de los
patrones de entrenamiento, es decir
wji = xi ( j ) i = 1, 2,...n y 1 ≤ j ≤ M (1)
Donde, xi ( j ) denota la entrada del nodo ith de la muestra jth en la capa de entrada. Las neuronas de la capa prototipo
se dividen en m grupos con Nt nodos en cada uno, correspondientes a su cluster. El vector de pesos de la neurona pth
en tth grupo se denota por
wt , p = wt + p -1 t = 1, 2,...m y p = 1, 2,...Nt (2)
Cuando el vector x(k) se da como entrada a la red, la clasificación de los vectores de entrada se inicia calculando la
entrada neta a la capa de patrones de la siguiente manera:
2
nj[1] = x (k ) - w t,p (3)
Por consiguiente, las neuronas de esta capa realizan cálculos
[1] ⎞
o[1] (k ) = exp ⎜-nj 2⎟

t = 1, 2,...m y p = 1, 2,...N t (4)
t,p ⎜ 2σ ⎟
⎝ t⎠

Donde, σ es un parámetro de suavizado correspondiente a la desviación estándar de la distribución gaussiana.


En este punto, también es posible determinar los diámetros de los conglomerados formados por los datos de
entrenamiento para estimar aproximadamente cuánto se solapan como:
0 ≤ D = max w - w 2 ≤ 2 (5)
t t,p t,q

La segunda capa oculta, denominada capa sumatoria, consta de m+1 nodos sumatorios elementales en los que cada
uno de los primeros m nodos representa una clase individual. Todos estos m nodos reciben las salidas de la capa
prototipo de forma que
Nt
2]
o[ (k ) = ∑vtto, p[1]t , (k ) (6)
p p =1

Donde, v l, p ≥ 1 es un peso sináptico de conexión prototipo-capa de suma utilizado para determinar la forma del cluster.
Estos pesos se inicializan a v l,p = 1 . El último nodo m+1th calcula la suma total
m Nt
2]
o[ (k ) = ∑∑v o[1] (k ) (7)
∑ t,pt,p
t =1 p =1

Cabe señalar que las sumas de la ecuación (6) son aproximaciones de Parzen de distribuciones de datos desconocidas
en los conglomerados. La última capa, denominada capa de normalización de la salida, está formada por m
divisores. Calcula el vector de grados de pertenencia y(k) como
[2]
0 ≤ y (k ) = ot (k ) ≤ 1 y ∑ y (k ) = (8)
1
m

∑2 t
t o[ ] (k ) t =1

La red es una combinación de redes neuronales probabilísticas y de regresión generalizada, y es capaz de


clasificar datos basándose en una decisión difusa sobre la pertenencia de una observación concreta a una
Derechos de autor de www.ijirset.com 4431
IJIRSET
ISSN: 2319 -8753

determinada clase.

V. E XPERIMENTOS REALIZADOS
Las redes neuronales probabilísticas tradicionales resuelven los problemas de predicción/clasificación considerando las
entradas estándar crisp. En cambio, en los problemas reales, las entradas no pueden tener límites de separación
puros. El problema de los conglomerados superpuestos es común cuando se consideran los parámetros de entrada, ya
que pueden pertenecer a más de una clase simultáneamente con ciertos grados de pertenencia. Como ya se ha
indicado, se ha utilizado una PNN difusa para tratar este tipo de entradas en lugar de una PNN difusa.

Derechos de autor de www.ijirset.com 4432


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013


que el PNN convencional. Para cada vector de entrada x, se determina el grado de pertenencia de cada factor a una
clase determinada. Por ejemplo, hemos considerado la función de pertenencia en forma de campana con 3 clases de
pertenencia para la entrada: Bueno, Medio y Malo para el Mérito en el último examen, Menos, Moderado y Entusiasta
para el Interés en el curso, etc. Los distintos componentes de evaluación reflejan los diferentes modos de evaluación
utilizados para valorar el rendimiento académico de los estudiantes. Como tal, hay una variedad de factores que
pueden ser considerados como criterios para predecir el rendimiento de los estudiantes, pero los factores que se han
tenido en cuenta para la predicción del rendimiento en el modelo propuesto son los que se muestran en la tabla I.
TABLA I
FACTORES PARA PREDECIR EL RENDIMIENTO ACADÉMICO DE LOS ESTUDIANTES
Mérito
1. Mérito en el último examen 2. Mérito medio
Interés
3. Interés en el curso 4. Interés por la 5. Interés por aprender
Creencia
6. Creer en el trabajo duro 7. Creencia en el
aprendizaje
Estudiar el comportamiento
8. Estudio con referencia 9. Estudio con revisión 10. Estudiar practicando ejemplos
Comportamiento en clase
11. Regularidad en la 12. Atención en clase 13. Tomar apuntes durante la 14. Hacer los
asistencia clase deberes
Antecedentes familiares
15. Educación de los padres 16. Ingresos de la familia 17. Apoyo financiero 18. Zona residencial

Se ha diseñado una red neuronal probabilística difusa (FPNN) utilizando MATLAB y se ha analizado en un conjunto
de datos de entrenamiento de 760 muestras que consta de más de 18 factores como entradas a la red. El conjunto de
entrenamiento de la FPNN está formado por un conjunto de
vector que comprende todos los los factores en x (1),
x (2),..., x ( j ) donde cada
T
x ( j ) = (x ( j ), x ( j ),...,x ( j )) El conjunto de datos disponible se valida de forma cruzada en una proporción
de 3:1 para dividirlo en
1 2 18

subconjuntos complementarios, realizando el análisis en un subconjunto denominado conjunto de entrenamiento de 570


muestras, y validando el análisis en el otro subconjunto denominado conjunto t est de 190 muestras. La validación cruzada
se utiliza básicamente para inspeccionar el rendimiento de una red neuronal en la predicción de resultados en términos de
variación de muestreo. Esta técnica estadística se utiliza aquí para evitar que la FPNN sobreajuste los datos.
A continuación, la FPNN se entrena mediante la matriz de grados de pertenencia 570X1 8 formada a partir de 570
muestras de 18 vectores factorizados. La FPNN simulada de la figura 2 muestra la FPNN de 4 capas con un vector de
entrada formado por 18 nodos de entrada, una capa de patrones, una capa de suma y una capa de salida con 3
nodos para el rendimiento académico del estudiante que representan tres clases: bueno, medio y malo. Como se
indica en la arquitectura de la FPNN, la salida de la red T
es un vector de
grados de pertenencia y ( j ) = ( y ( j ), y ( j ), y ( j )) . Se dice que un alumno pertenece a una clase cuyo grado
de
1 2 3

función de pertenencia es máxima.

Derechos de autor de www.ijirset.com 4433


IJIRSET
ISSN: 2319 -8753

Fig. 2 Red neuronal probabilística difusa simulada

Para reducir el número de nodos ocultos y probar la red con un conjunto más pequeño de patrones ejemplares, se
dividió un conjunto de datos de 400 en dos subconjuntos utilizando el mismo procedimiento de validación cruzada, lo
que dio como resultado un conjunto de entrenamiento de 300 y un conjunto de prueba de 100 muestras. La figura 3
muestra el conjunto de datos utilizado para entrenar la FPNN, que se distribuye por igual entre las tres clases.

Derechos de autor de www.ijirset.com 4434


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013

Fig. 3 Clases de vectores de formación


Una vez entrenada la red, calcula las probabilidades de cada dato de entrenamiento de pertenecer a cada clase como se
ve en la Tabla
II. Esta tabla ayuda a determinar la probabilidad de que cada alumno pertenezca a cada clase.
CUADRO III
PROBABILIDADES DE CLASE DE LA MUESTRA DE DATOS DE ENTRENAMIENTO
Clase1 - Clase2 - Clase3 - Clase1 - Clase2 - Clase3 -
Muestra Muestra
# Bien Media Pobre # Bien Media Pobre
1 1.0000 0.0000 0.0000 : : : :
2 1.0000 0.0000 0.0000 561 0.0804 0.3916 0.5280
3 0.6776 0.0136 0.3088 562 0.2816 0.1442 0.5742
4 0.6482 0.0216 0.3302 563 0.4621 0.0556 0.4823
5 0.5927 0.0210 0.3863 564 0.1737 0.2336 0.5927
6 0.5982 0.0216 0.3803 565 0.1317 0.2922 0.5761
7 0.6700 0.0202 0.3098 566 0.3157 0.1285 0.5559
8 0.6181 0.0297 0.3522 567 0.0927 0.3954 0.5119
9 0.6944 0.0098 0.2958 568 0.2785 0.0985 0.6230
10 0.6038 0.0298 0.3664 569 0.0909 0.3585 0.5506
11 0.6124 0.0294 0.3582 570 0.3806 0.1051 0.5143

La red neuronal se probó con distintos conjuntos de muestras de entrenamiento y prueba para controlar su
rendimiento. Tras considerar muchos valores posibles, el parámetro de suavizado se fijó en 0,1, ya que se
comprobó que minimizaba el error de clasificación .

VI. RESULTADOS Y DEBATE


Los resultados del experimento realizado demuestran que el error global de entrenamiento es de 2,6667 y el error
cuadrático medio es de 0,0265. Con 18 neuronas en la capa de entrada y neuronas iguales al número de
patrones ejemplares de entrenamiento en la capa oculta, la red consigue una detección correcta cercana a la
esperada. La Tabla III muestra una comparación de los resultados de las predicciones de la FPNN con dos conjuntos
de datos de distinto tamaño. Con el aumento del tamaño del conjunto de datos, el número de neuronas en la capa
oculta aumenta sin que se produzcan mejoras significativas en los resultados de predicción. Por lo tanto,
finalmente se utilizó un conjunto de datos de 400 (300+100) para entrenar la red.

Derechos de autor de www.ijirset.com 4435


IJIRSET
ISSN: 2319 -8753

La razón básica de los errores de clasificación se debe a la presencia de ruido en los datos de prueba. El
método de validación cruzada mejora la capacidad de generalización de la red. Se realizaron experimentos por
separado con y sin el método de validación cruzada para entrenar la FPNN.

Derechos de autor de www.ijirset.com 4436


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013


CUADRO III II
COMPARACIÓN DEL RESULTADO DE LA PREDICCIÓN FPNN
Tamaño del conjunto de datos Tamaño del conjunto de datos
- 300 - 570
Clase Porcentaje de predicciones Porcentaje de predicciones
correctas correctas
Clase 1 99 % 90 %
Clase 2 100 % 96 %
Clase 3 96.7 % 87.5 %

La red entrenada sin validación cruzada converge en 90 minutos aproximadamente, mientras que cuando se aplica el
método de validación cruzada, converge en 47 minutos, es decir, casi menos de la mitad de tiempo que una
red de retropropagación típica, que tarda unos 120 minutos en entrenarse. Esto indica que la convergencia
de la red se ve afectada significativamente por el uso de un método de validación cruzada.

VII. C ONCL USIÓN


Se han estudiado varias razones para predecir el rendimiento académico de los estudiantes y se ha propuesto un
modelo de predicción utilizando una red neuronal probabilística difusa. El modelo puede desempeñar un papel
importante en el ámbito académico al predecir el nivel de los alumnos de la clase y proporcionar una
perspectiva al profesor para planificar mejor las clases en función del nivel de los alumnos. De este modo, el
profesor puede mantener un equilibrio entre la calidad y la cantidad de los conocimientos impartidos en clase.
Desde el punto de vista de la institución, una predicción temprana ayuda a identificar las incapacidades de los
alumnos y a tomar las medidas oportunas para mejorarlas, con lo que los alumnos quedan atrapados.
Los métodos estadísticos y de otro tipo para predecir el rendimiento académico de los estudiantes carecen de
la consideración de varios factores determinantes relevantes. La razón del desconocimiento de dichos factores se
debe a su vaguedad, por lo que el método propuesto que utiliza la Red Neuronal Probabilística Difusa ofrece
mejores resultados. Los experimentos y los resultados revelan que la FPNN tarda menos tiempo en entrenarse y
que los resultados de las pruebas son similares a los esperados. Esto aumenta la capacidad de la red para realizar
predicciones de forma más correcta. Los resultados indican que la red propuesta muestra una precisión de clasificación
media del 98,56%. Se puede seguir trabajando para mejorar la precisión de la clasificación mediante el uso de
diferentes arquitecturas de RNA.

R EFERENCIAS
[1] Adeli H. y Panakkat A., A probabilistic neural network for earthquake magnitude prediction, Neural Networks, nº 22, pp. 10 18-1024, 2009.
[2] Antons C.M. y Maltz E.N., Expanding the role of institutional research at small private universities: A case study in enrollment management
using data mining, New Directions for Institutional Research, Vol. 2006, No. 131, pp. 69-81, 2006.
[3] Bailey B.L., Let the data talk: Developing models to explain IPEDS graduation rates, New Directions for Institutional Researc h, nº 131, pp. 101-
11515, 2006.
[4] Bascil M.S. y Oztekin H., A study on hepatitis disease diagnosis u sing probabilistic neural network, Journal of Medical Systems, Vol. 36,
No. 3, pp. 1603-1606, 2012.
[5] Biswas R., An Application of Fuzzy Sets in Students' Evaluation, Fuzzy Sets and Systems, nº 74, pp. 187-194, 1995.
[6] Bodyanskiy Ye., Gorshkov Ye., Kolo dyazhniy V., Resource-Allocating Probabilistic Neuro -Fuzzy Network, In: Proceedings of International
Conference on Fuzzy Logic and Technology, Alemania, 2003.
[7] Chamorro-Premuzic T., y Furnham A., Personality, intelligence and approaches to learning as predictors of academic performance.
Personality and Individual Differences, nº 44, pp. 1596 -1603, 2008.
[8] Chang L., Applying data mining to predict college admissions yield: A case study, New Directions for Institutional Research, nº 131, 2006.
[9] Chen S.M. y Lee C.H., New Methods for Students' Evaluation Using Fuzzy Sets, Fuzzy Sets and Systems, nº 104, pp. 209 - 218, 1999.
[10] Chen C., Lee J. y Lin M., Classification of underwater signals using neural networks, Tamkang Journal of Science and Engin eering, Vol. 3, nº
1, pp. 31-48, 2000.
[11] Choi H. H., Robust stabilization of uncertain fuzzy -time-delay systems using sliding -mode-control approach, IEEE Transactions on Fuzzy
Systems, Vol. 18, No. 5, pp. 979-984, 2010.
[12] Chung T.Y., Chen Y. M. y Tang S. C., Expert Systems wi th Applications, A hybrid system integrating signal analysis and probabilistic
neural network for user motion detection in wireless networks, n.º 39, pp. 3392 -3403, 2012.
[13] Cowell R., Lauritzen S., Spiegelhater D. y David P., Probabilistic networks and ex pert systems. Nueva York, NY: Springer, 2003.
[14] Deniz D. Z., y Ersan I., An academic decision -support system based on academic performance evaluation for student and program
assessment, International Journal of Engineering Education, Vol. 18, No. 2, pp. 236-244, 2002.

Derechos de autor de www.ijirset.com 4437


IJIRSET
ISSN: 2319 -8753

[15] Ding B., Homogeneous polynomially nonquadratic stabilization of discrete -time Takagi-Sugeno systems via nonparallel distributed
compensation law, IEEE Transactions on Fuzzy Systems, Vol. 18, No. 5, pp. 994 -1000, 2010.
[16] Duda R.O., Pattern Classification 2nd Edition with Computer Manual, John Wiley and Sons Inc., USA , 2004.
[17] Fourali C., Fuzzy Logic and the Quality of Assessment of Portfolios, Fuzzy Sets and Systems, nº 68, pp. 123 - 139, 1994.
[18] Holmes E., Nicholson J., y Tranter G., Metabonomic characterization of genetic variations in toxicological and metabolic responses using
probabilistic neural networks. Chemical Research in Toxicology, Vol. 14, No. 2, pp. 182 -191, 2001.

Derechos de autor de www.ijirset.com 4438


IJIRSET
ISSN: 2319 -8753

Revista internacional de investigación innovadora en


ciencias,

Ingeniería y Tecnología
(Organización con certificación ISO 3297: 2007)

Vol. 2, número 9, septiembre de 2013


[19] Huang H. H. y Kuo Y. H., Cross-lingual document representation and semantic similarity measure: A fuzzy set and rough set based
approach, IEEE Transactions on Fuzzy Systems, Vol. 18, No. 6, pp. 1098 -1111, 2010.
[20] Ibrahiem M.M., Emary El. y Ramakrishnan S., On the Application of Various Probabilistic Neural Networks in Solving Different Pattern
Classification Problems, World Applied Sciences Journal, Vol. 4 No. 6, pp. 772 -780, 2008.
[21] Kim D.K., Kim D.H. y Chang S.K., Modified probabilistic neural network considering heterogeneous probabilistic density func tions in the design
of breakwater, KSCE Journal of Civil Engineering, Vol. 11, pp. 65 -71, 2007.
[22] Kim D.K., Lee J.J., Lee J.H. y Chang S.K., Application of Prediction of Probabilistic Neural Networks of Concrete Strength, Journal of
Materials in Civil Engineering, Vol. 1 7, No. 3, pp. 353-362, 2005.
[23] Lassibille G. y Gómez L. N., ¿Por qué abandonan los estudiantes de educación superior? Evidence from Spain, Education Economics, Vol. 16,
n.º 1, pp. 89-105, 2007.
[24] Lin S. H., Kung S. Y. y Lin L. J., Face recognition/detection by probabilis tic decision-based neural network, IEEE transactions on neural
networks, Vol. 8, No.1, pp.114-132, 1997.
[25] Lofti A., y Benyettou A., Using probabilistic neural network for handwritten digit recognition, Journal of Artificial Intel ligence, Vol. 4, No. 4,
pp. 288-294, 2011.
[26] Ma J., and Zhou D., Fuzzy set approach to the assessment of student-centered learning, IEEE Transactions on Education, Vol. 43, No. 2, pp.
237-241, 2000.
[27] Merceron A y Yacep K., Minería de datos educativos: A case study, In proceedings of the 12th International Conference on Artificial
Intelligence in Education AIED, Amsterdam, The Netherlands, IOS Press , 2005.
[28] Nolan J., A Prototype Application of Fuzzy Logic and Expert Systems in Education Assessment, AAAI Proceedings , pp. 1134-1139, 1998.
[29] Osman T. y Bahattin K., An adaptive neuro-fuzzy model for prediction of student's academic performance, Computers & Industrial
Engineering, nº 57, pp. 732-741, 2009.
[30] Parzen E., On estimation of a probability density function and mode, Ann. Math. Statist., Vol. 33, No. 3, pp. 1065-1076, 1962.
[31] Pharr S., Bailey J. y Dangerfield B., Admission/Continuance Standards as Predictors of Academic Performance of Business Stu dents, Journal
of Education for Business, pp. 69 -74, 1993.
[32] Raghu P.P. y Yegnanarayana B., Supervised texture classification using a probabilistic neural network and constraint satisfaction model, IEEE
transactions on neural networks, Vol. 9, No. 3, pp. 516 -522, 1998.
[33] Shan Y., Zhao R., Xu G., Liebich H. M. y Zhang Y., Application of probabilist ic neural network in the clinical diagnosis of cancers based on
clinical chemistry data, Analytica Chimica Acta, nº 471, pp. 77 -86, 2002.
[34] Sinha S. K. y Pandey M. D., Probabilistic Neural Network for Reliability Assessment of Oil and Gas Pipelines, Computer-aided civil and
infrastructure engineering, Vol. 17, No. 5, pp. 320 -329, 2002.
[35] Specht D. F., Probabilistic neural networks for classification mapping, or associative memory en Proceedings of IEEE Internat ional
Conference on Neural Networks, Vol. 1 , 1988.
[36] Specht D. F., Probabilistic neural networks, Neural Networks, Vol. 3, pp. 109 - 118, 1990.
[37] Specht D.F., Shapiro P.D., Generalization accuracy of probabilistic neural networks compared with back -propagation networks. Int Joint
Conference on Neural Networks, pp. 887-892, 1991.
[38] Tinto V., Limits of theory and practice in student attrition, Journal of Higher Education, Vol. 53, pp. 687 -700, 1998.
[39] Tran T.P., Cao L., Tran D. y Nguyen C.D., Novel intrusion detection using probabilistic neural network and a daptive boosting, International J
Comput. Sci. Inform. Secur., Vol. 6, pp. 83 -91, 2009.
[40] Tran T.P., Nguyen T.T.S., Tsai P. y Kong X., BSPNN: Boosted subspace probabilistic neural network for email security. Artif . Intell. Rev., Vol.
35, pp. 369-382, 2011.
[41] Wang, Y., Adali, T., Kung, S. Y. y Szabo, Z., Quantification and segmentation of brain tissues from MR images: a probabilis tic neural
network approach, IEEE transactions on image processing, Vol. 7, No. 8, pp.1165 -1181, 1998.
[42] Wooten, T.C., Factors influencing student learning in introductory accounting classes: A comparison of traditional and nontraditional students,
Issues in Accounting Education, Vol. 13, No. 2, pp. 357 -378, 1998.

BIOGRAFÍA

Nidhi Arora cuenta con más de 11 años de experiencia docente a nivel de posgrado. Está asociada a
muchas organizaciones técnicas y de investigación y es miembro activo del consejo de revisores
de revistas internacionales indias y extranjeras. Sus trabajos de investigación se publican en
revistas nacionales e internacionales como IEEE y Springer Verlag London Ltd. Sus áreas de
interés son la inteligencia artificial, la informática blanda, la simulación y el modelado, los
sistemas híbridos y los sistemas expertos y de apoyo a la toma de decisiones.

El Dr. Jatinderkumar R. Saini es Doctor por la VNSGU, Surat. Cuenta con la certificación IBM
Certified Database Associate (DB2) y IBM Certified Associate Developer (RAD). Ha participado en
casi 25 países y ha sido miembro del comité de programa de 40 conferencias internacionales
(incluidas las del IEEE) y miembro del consejo editorial o revisor de 25 revistas internacionales
(incluidas las que tienen factor de impacto). Ha publicado 33 artículos de investigación y
16 ponencias en prestigiosas conferencias y revistas nacionales e internacionales. Es miembro
de ISTE, IETE, ISG y CSI.
ISSN: 2319 -8753

Derechos de autor de IJIRSET www.ijirset.com 4432

Ver estadísticas de publicación

También podría gustarte