Está en la página 1de 3

Proyecto clasificación, automatización III

Angie Daniela Grisales Jaramillo, Tania Lisdey Grajales Soto


Medellín
Instituto Tecnológico Metropolitano
angiegrisales220860@correo.itm.edu.co, taniagrajales213902@correo.itm.edu.co

Resumen. En el presente proyecto, se seleccionó una base de datos para clasificación, identificando sus
atributos, las características que se emplearon, el número de muestras y la utilidad de dicha base de
datos. Mediante la implementación de un perceptrón simple se clasificaron los datos y se registró el
desempeño de este. Posterior a esto, se evaluó la ejecución de los algoritmos en términos de sensibilidad,
especificidad, precisión, exactitud y se comparó el desempeño y los tiempos de ejecución de cada
algoritmo.

1 Introducción gravedad (benigna o maligna) de ésta. Esta


base de datos, contiene 961 muestras y
Este proyecto, tiene como objetivo seleccionar una emplea 6 características:
base de datos que, mediante la implementación de un
perceptrón simple se clasifique la base de datos y se  Evaluación BI-RADS: 1 a 5
evalué el desempeño de los algoritmos. Ahora bien, (ordinal)
Para una primera comprensión del presente informe  Edad: edad del paciente en años
debemos enfocarnos en saber qué es la clasificación (entero)
desde la automática y qué es un perceptrón simple.
 Forma: forma de la masa: redondo
La clasificación desde la automática, busca encontrar = 1, óvalo = 2, lobular = 3, irregular
una función matemática que a partir de un conjunto de = 4 (nominal)
características de entrada me arroje la clase del objeto.
Existen dos tipos de características: nominales y  Margen: margen de la masa:
continuas. Las características nominales son las que su circunscrito = 1, microlobulado = 2,
valor se limita a un conjunto limitado de posibilidades. oculto = 3, mal definido = 4,
Las características continuas a diferencia de las espiculado = 5 (nominal)
nominales, pueden tomar cualquier valor.
 Densidad: densidad de masa alta =
Por otra parte, un perceptrón simple es un algoritmo 1, iso = 2, baja = 3, que contienen
que imita el comportamiento de una neurona para grasa = 4 (ordinal)
realizar tareas de clasificación. En un perceptrón
 Gravedad (clase): benigno = -1 o
simple, cada característica interactúa con un peso
maligno = 1 (binominal)
sináptico.
2. En esta etapa, se implementó un perceptrón
Este informe se ha dividido en 3 partes: la primera
simple para la clasificación de los datos y
parte, hace referencia a la metodología, la cual
posterior a esto la evaluación del desempeño
describe el procedimiento que se siguió para lograr los
del algoritmo. Esto se ejecutó desde un
resultados. En la segunda parte, se expone los análisis
programa principal llamado “mamogratrain”
practicados y lo que se obtuvo. Finalmente, la tercera
el cual, para su realización, fue necesaria la
parte hace alusión a las conclusiones donde se detalla
implementación de 3 pasos:
el conocimiento nuevo adquirido a partir de los
resultados obtenidos.  1er paso: organización de datos.
Mediante un programa en Matlab se
2 Metodología cargó la base de datos y se creó el
La realización de este proyecto, consistió en el vector de clases (Y) y la matriz de
desarrollo de seis etapas: características (X). Después, se creó
una función denominada
1. En esta primera etapa se seleccionó una base “normalización” que es la encargada
de datos, la cual fue tomada de la página web de añadir una matriz de ceros a la
“UCI Machine Learning Repository” en el matriz de características. Para
área ciencias de la vida. La base de datos finalizar con este paso, se creó la
seleccionada “Mammographic Mass”, se función “variación” que me divide
puede utilizar para diagnosticar una lesión en 70/30 los datos (70
mamaría sospechosa y a su vez, clasifica la
entrenamiento y 30 evaluar) y se 3 Resultados.
crearon variables como X_train,
Y_train, Y_test y X_test para  Mediante la ejecución del programa
guardar esa división “momogratrain”, donde se implementó el
algoritmo de un perceptrón simple con una
 2do paso: entrenar. se creó una fun- función de activación signo, se cargaron los
ción denominada “entrenamien- datos, se clasificaron y se evaluó su
toPerceptron”, donde se le asignan desempeño con una matriz de confusión que
valores aleatorios a W (pesos sináp- me permite determinar el número de
ticos), se calcula la nueva posición verdaderos negativos, verdaderos positivos,
de W y se crea un ciclo while dentro falsos positivos y falsos negativos que
de la función para repetir lo anterior presenta un clasificador.
hasta que se cumpla un criterio de
parada.
 3er paso: evaluar. Mediante la fun-
ción “evaluacionPerceptron” y la
función de activación (signo) se cal-
culó el vector de clases estimadas.

Finalmente, se creó un programa


principal llamado: “mamogratrain”
donde fue implementadas todas las
funciones anteriores y así crear el
perceptrón simple que clasificó los
datos y para la evaluación del
desempeño se creó una matriz de
confusión, llamada en el programa
como “C”, que me permite
determinar el número de verdaderos
negativos, verdaderos positivos,
falsos positivos y falsos negativos
que presenta un clasificador.
Figura 1.

3. Para esta tercera etapa, se consultó otro En la figura 1, se puede observar los datos
método (diferente al de las iteraciones) para clasificados en X_test, Y_test, Y_train,
detener el gradiente descendente y para X_train (en estas variables clasifican los
clasificación de la base datos. datos de la variación 70/30), X (en esta
variable se guarda la clase) y
El método escogido… Y(características), Y_es, W. Ademas también
4. En una cuarta etapa, se cambió en el modelo se puede observar la evaluación del
del perceptrón la función de activación signo, desempeño en términos de Fp, Fn, Vn, Vp.
por la función sigmoidal. La función
sigmoidal también es utilizada como función
de activación, pero esta a diferencia de la
función signo, evalúa entre [0 1], la función
signo evalúa entre [-1 1]. Para esta etapa fue
necesario editar la base de datos, cambiando
los menos uno por ceros.
5. Para una quinta etapa, se evaluó el
desempeño de los algoritmos en términos de
la sensibilidad, especificidad, exactitud y el Figura 2
valor predictivo negativo (la nueva medida). En la figura 2, se observa la matriz de
El valor predictivo negativo, es la confusión, denominada “c”, también se
probabilidad de que un negativo, sea muestra el tiempo de ejecución del programa
realmente positivo y es el cociente de con una función de activación signo.
positivos con resultado negativo entre el
número total de negativos.  Posterior a esto, se cambió la función de
activación signo por una función de
6. Finalmente, se comparó el desempeño y los activación sigmoidal. Se clasificaron los
tiempos de ejecución de los algoritmos. datos y se evaluó el desempeño de ambos
algortimos, en términos de exactitud (Exac),

2
especificidad (Esp), sensibilidad (Sen) y
valor predictivo negativo (Vpn), como se
indica en las siguientes figuras:

https://archive.ics.uci.edu/ml/datasets/Mammographi
c+Mass
http://scielo.isciii.es/scielo.php?script=sci_arttext&pi
d=S1139-76322013000200013

Figura 3 (función sigmoidal)

Figura 4 (función signo)

 Al comparar el desempeño y los tiempos de


ejecución del algoritmo con la función de
activación signo, respecto al algoritmo con la
función de activación sigmoidal

También podría gustarte