Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Marco López-Sánchez[0000-0003-0644-5441]
Resumen.
Palabras clave: Deep learning, CNN,Tensor Flow, python, visión por computadora.
1 Introducción
Esa capacidad de una red neuronal para ingerir datos y extraer representaciones
útiles sobre la base de ejemplos es lo que hace que el Deep learning sea tan poderoso.
El reconocimiento facial ha sido uno de los casos más famosos y estudiados, en
donde recientemente las técnicas de Deep learning son utilizadas para este fin, siendo
la arquitectura de Redes Neuronales de Convolución (CNN por sus siglas del inglés
Convolutional Neural Network) la más utilizadas, obteniendo resultados sobresalientes
superando incluso el desempeño humano [20].
Las CNN se introdujeron por primera vez en la década de 1980 y 1990, pero se
descuidó debido a su complejidad en las aplicaciones del mundo real. Sin embargo, se
han retomado gracias al interés dentro de los científicos y desde entonces ha mostrado
resultados sobresalientes en el campo de visión computacional mientras sigue creciendo
en un ritmo acelerado [5].Desde un punto de vista estructural, las CNN se componen
de tres diferentes capas: capas de convolución, capas de agrupación y capas
completamente conectadas.
Capa completamente conectada: en esta capa, las neuronas tienen una conexión
completa con todas las activaciones de las capas anteriores. Conecta neuronas en una
capa con neuronas en otra capa.
3.2 PyTorch
El framework PyTorch es una herramienta para el aprendizaje profundo desarrollada
por la división de inteligencia artificial de Facebook para procesa análisis de imágenes
a gran escala, incluida la detección, segmentación y clasificación de objetos, PyTorch
también permite escribir funciones que se ejecuten automáticamente en un entorno
GPU[10].
3.3 MXNet
Para construir un modelo de Deep learning son necesarios cuatro pasos fundamentales:
2012, las CNN se han vuelto frecuentes. Esto se debe a la gran cantidad de datos de
entrenamiento y a los recursos informáticos adaptables, como las GPU. Siguiendo esta
misma línea, Krizhevsky [7] entrenó una red convolucional para clasificar imágenes en
la competencia ILSVRC-2012 y obtuvo una precisión de reconocimiento atractiva.
Mientras tanto, las arquitecturas basadas en CNN como GoogLeNet [14] y VGG [2],
han sido mucho más amplias y profundas, dando lugar a enormes parámetros de red y
buenos rendimientos.
En [22], los autores introdujeron una nueva capa para incrustar la estrategia del
parche en la arquitectura convolucional para mejorar la eficacia de la representación
facial, este enfoque hizo un mejor uso de las interacciones entre las características
globales y locales en el modelo. El trabajo de [17] supervisó una CNN mediante una
nueva pérdida de centro de señal y obtuvo la precisión de vanguardia en tres
importantes puntos de referencia de reconocimiento facial.
6 Conclusiones
la generación de modelos, una de las grandes ventajas que tiene el uso de Deep learning
sobre los modelos tradicionales de aprendizaje automático,es que la red puede aprender
a diseñar las características que necesita para resolver el problema.
Referencias
[1] An, F., Liu, Z.: Facial expression recognition algorithm based on parameter
adaptive initialization of CNN and LSTM. Vis. Com- put. 35, 1–16 (2019).
https://doi.org/10.1007/s00371-019-01635 -4.
[2] Chatfield, K., Simonyan, K., Vedaldi, A., Zisserman, A.: Return of the devil in the
details: delving deep into convolutional nets, 2014. arXiv:1405.3531.
[3] Fatma S Abousaleh, Tekoing Lim, Wen-Huang Cheng, Neng-Hao Yu, M Anwar
Hossain, and Mohammed F Alhamid. A novel comparative deep learning framework
for facial age estimation. EURASIP Journal on Image and Video Processing,
2016(1):1–13, 2016.
[4] Guo, K., Wu, S., Xu, Y.F.: Face recognition using both visible light image and near-
infrared image and a deep network. CAAI Trans. Intell. Technol. 2(1), 39–47 (2017)
[5] Hijazi S, Kumar R, and Rowen C (2015) Using convolutional neural networks for
image recognition, ed.
[6] Hosseini, M. P., Lu, S., Kamaraj, K., Slowikowski, A., & Venkatesh, H. C. (2020).
Deep learning architectures. In Deep learning: concepts and architectures (pp. 1-24).
Springer, Cham.
[7] Krizhevsky, A., Sutskever, I., Hinton, G.E.: Imagenet classifica- tion with deep
convolutional neural networks. In: Advances in Neural Information Processing
Systems, pp. 1097–1105 (2012).
[8] Lv, J.J., Cheng, C., Tian, G.D., Zhou, X.D., Zhou, X.: Landmark perturbation-based
data augmentation for unconstrained face rec- ognition. Sig. Process. Image Commun.
47, 465–475 (2016).
[9] Santanu Pattanayak. Pro deep learning with TensorFlow: a mathematical approach
to ad- vanced artificial intelligence in Python. Apress, 2017.
[10] Satya Mallick. A brief history of image recognition and object detection. https:
//learnopencv.com/image-recognition-and-object-detection-part1/, 2016.
[11] Schroff, F., Kalenichenko, D., Philbin, J.: Facenet: a unified embedding for face
recognition and clustering. In: Proceedings of the IEEE Conference on Computer
Vision and Pattern Recogni- tion, pp. 815–823 (2015).
[12] Sodhi, Pinky, Naman Awasthi, and Vishal Sharma. "Introduction to machine
learning and its basic application in Python." Proceedings of 10th International
Conference on Digital Strategies for Organizational Success. 2019.
10
[13] Sun, Y., Wang, X., Tang, X.: Deep learning face representation from predicting
10,000 classes. In: Proceedings of the IEEE Conference on Computer Vision and
Pattern Recognition, pp. 1891–1898 (2014).
[14] Szegedy, C., Liu, W., Jia, Y., et al.: Going deeper with convo- lutions. In:
Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, pp.
1–9 (2015).
[15] Taigman, Y., Yang, M., Ranzato, M.A., Wolf, L.: Deepface: clos- ing the gap to
human-level performance in face verification. In: Proceedings of the IEEE Conference
on Computer Vision and Pattern Recognition, pp. 1701–1708 (2014).
[16] Vinay, A.; Hebbar, D.; Shekhar, V.S.; Murthy, K.B.; Natarajan, S. Two novel
detector-descriptor based approaches for face recognition using sift and surf. Procedia
Comput. Sci. 2015, 70, 185–197.
[17] Wen, Y., Zhang, K., Li, Z., Qiao, Y.: A discriminative feature learning approach
for deep face recognition. In: European Conference on Computer Vision, pp. 499–515.
Springer, Cham (2016).
[18] Witold Pedrycz and Shyi-Ming Chen. Deep Learning Concepts and Architectures.
Springer, (2020).
[19] Wu, X., He, R., Sun, Z., Tan, T.: A light cnn for deep face rep- resentation with
noisy labels. IEEE Trans. Inf. Forensics Secur. 13(11), 2884–2896 (2018).
[20] Yann LeCun, Yoshua Bengio, and Geoffrey Hinton. Deep learning. Nature,
521(7553):436– 444, (2015).
[22] Zhang, Y., Shang, K., Wang, J., Li, N., Zhang, M.M.: Patch strat- egy for deep
face recognition. IET Image Proc. 12(5), 819–825 (2018).