Está en la página 1de 92

© Komputer Sapiens, Año XIV Volumen II, mayo-agosto 2022, es una publicación cuatrimestral

de la Sociedad Mexicana de Inteligencia Artificial, A.C., con domicilio en Ezequiel Montes 56 s/n,
Fracc. los Pilares, Metepec, Edo. de México, C.P. 52159, México, http://www.komputersapiens.org,
correo electrónico: editorial@komputersapiens.org, tel. +52 (833)357.48.20 ext. 3024, fax +52 (833)
215.85.44. Impresa por Sistemas y Diseños de México S.A.
de C.V., calle Aragón No. 190, colonia Álamos, delegación Benito Juárez, México D.F., C.P. 03400, México, se ter-
minó de editar el 15 de mayo de 2022.
Reserva de derechos al uso exclusivo número 04-2009-111110040200-102 otorgado por el Instituto Nacional de
Derechos de Autor. ISSN 2007-0691.
Los artı́culos y columnas firmados son responsabilidad exclusiva de los autores y no reflejan necesariamente los
puntos de vista de la Sociedad Mexicana de Inteligencia Artificial. La mención de empresas o productos especı́ficos
en las páginas de Komputer Sapiens no implica su respaldo por la Sociedad Mexicana de Inteligencia Artificial.
Queda estrictamente prohibida la reproducción total o parcial por cualquier medio, de la información aquı́ contenida
sin autorización por escrito de los editores.
Komputer Sapiens es una revista de divulgación en idioma español de temas relacionados con la inteligencia artificial.
Creada en LATEX, con la clase papertex disponible en el repositorio CTAN : Comprehensive TeX Archive Network,
http://www.ctan.org/
Indizada en el IRMDCT de CONACYT y en Latindex.
Directorio SMIA Directores Fundadores Gustavo Vargas Hakim
Presidente Ildar Batyrshin Carlos Alberto Reyes Garcı́a Luis Zúñiga Avilés
Vicepresidente Oscar Herrera Alcántara Ángel Kuri Morales Nora Reyes
Secretario Francisco Hiram Calvo Castro Silvia Albarrán
Tesorera Marı́a de Lourdes Martı́nez Villaseñor Comité Editorial Carlos Fernández-Fernández
Vocales: Obdulia Pichardo Lagunas Ildar Batyrshin Nelson Rangel Valdez
Sabino Miranda Jiménez Oscar Herrera Alcántara Federico Alonso-Pecina
Roberto A. Vázquez Espinoza de los Monteros Jesús Favela Vara Adriana Cervantes
Hiram Erendin Ponce Espinosa Sofı́a Natalia Galicia Haro Efrén Mezura-Montes
Noé Alejandro Castro Sánchez Miguel González Mendoza Eduardo Morales
Iris Iddaly Méndez Gurrola Raúl Monroy Borja Raúl Monroy Borja
Omar Montaño Rivas Eduardo F. Morales Manzanares Laura Cruz
Néstor Velasco Bermeo Leonardo Garrido Luna Mariana Miranda-Varela
Gustavo Arroyo Figueroa Carlos Alberto Reyes Garcı́a Candy Sosa Jiménez
Sofı́a Natalia Galicia Haro Antonio Sánchez Aguilar Erendira Rendón
Juan Crisoforo Martı́nez Miranda Luis Enrique Sucar Succar Claudia Gómez
Iván Olvera Rodrı́guez Ángel Kuri Morales Antonio Camarena-Ibarrola
Leobardo Morales Tiburcio José A. Martı́nez Flores Lisbeth Rodrı́guez
Gilberto Ochoa Ruiz Juan Manuel Ahuactzin Larios Guillermo Hoyos-Rivera
David Eduardo Pinto Avendaño Manuel Montes y Gómez Oscar Herrera
Antonio Marı́n Hernández Ofelia Cervantes Villagómez Ericka Janet Rechy Ramı́rez
César Jesús Núñez Prado Alexander Gelbukh Ángel Estévez
Grigori Sidorov Héctor Limón
Komputer Sapiens Laura Cruz Reyes Belem Saldı́var
Director general Ildar Batyrshin Ramon Brena Pinero Roberto Alejo
Editora en jefe Karina Mariela Figueroa Mora Juan Humberto Sossa Azuela Karina Figueroa
Editor cientı́fico Héctor Gabriel Acosta Mesa Félix Castro Otniel Portillo Rodrı́guez
Editores asociados Marco Antonio Aguirre Lam Juan Jacinto-Villegas
Laura Cruz Reyes Árbitros Alberto Ochoa-Zezzatti
Editores invitados Rosa Marı́a Valdovinos Rosas Aldo Márquez-Grajales Héctor Acosta-Mesa
Coordinadora de producción Viridiana Mena Gómez Fernando Aldana Franco Gregorio Toscano-Pulido
e-Tlakuilo Karina Figueroa Ramón Brena Héctor Rodrı́guez-Rangel
Rosa Marı́a Valdovinos Ángel Andrade Asdrúbal López Chau
Estado del IArte Reyna Carolina Medina Ramı́rez Rigoberto Martı́nez Méndez Rafael Rivera-López
Jorge Rafael Gutiérrez Pulido Ángel Sánchez Garcı́a Daniela Alejandra Ochoa
Sakbe Claudia G. Gómez Santillán Fernando Arámbula Martha Avendaño Garrido
Laura Cruz Reyes Matı́as Alvarado Sonia Mestizo-Gutiérrez
Laura Gómez Cruz Diego Tlapa
IA & Educación J. Julieta Noguez Monroy Saúl Domı́nguez-Isidro
Marı́a Lucı́a Barrón Estrada Vianney Muñoz
Marı́a Yasmı́n Hernández Pérez David Valle-Cruz
Deskubriendo Konocimiento Alejandro Guerra Hernández David Rı́os
Gildardo Sánchez Ante Hugo Jair Escalante
Asistencia técnica Alan G. Aguirre Lam Héctor Avilés-Arriaga
Corrección de estilo Gilberto Rivera Zárate Nancy Pérez-Castro
Marcela Quiroz Castellanos Tania Turrubiates-López
Sonia Lilia Mestizo Gutiérrez José Sánchez-Cervantes
Guillermo de Jesús Hoyos Rivera Luis Fernández-Martı́nez
Susana Aurora Velasco Montiel Adan Justo
Nicandro Cruz Ramı́rez Mireya Salgado Gallegos
Claudia Leticia Dı́az González Miguel Zúñiga-Garcı́a
Leonardo Romero Muñoz Guillermo Santamarı́a-Bonfil
Nelson Rangel Valdez Rocı́o Barrientos-Martı́nez
José Antonio Camarena Ibarrola Jaime Cerda
Luis Miguel Garcı́a Velázquez Paúl Hernández
Héctor J. Fraire Huacuja Luis Castro
Ruth Esmeralda Barreda Guajardo Cuauhtémoc Sánchez
Portada Marı́a Fernanda Hernández Arroyo Sergio Hernández Méndez
Komputer Sapiens Mayo - Agosto 2022 k Año XIV, Vol.II

Contenido
Escenarios para determinar los estímulos que brindará
un asistente tecnológico a una persona con deterioro
cognitivo
Pág. 10 ⇒Victor M. Montaño Serrano, Juan Manuel Jacinto Villegas, Adriana H.
Vilchis González y Otniel Portillo Rodríguez
Robots médicos de punción percutánea compatibles con resonancia magné-
tica
Pág. 16 ⇒ Isis Danae Sánchez Hernández, Adriana Herlinda Vilchis González y Juan
Carlos Ávila Vilchis
De Big Data al Smart Data en datos no balanceados con alta dimensionalidad
y baja densidad: un análisis experimental de técnicas de sobremuestreo
Pág. 21 ⇒ Armando Bolívar, Vicente García, Roberto Alejo y Rogelio Florencia-Juárez
Reglas de asociación para el estudio de vaginosis bacteriana
Pág. 26 ⇒ Freddy de la Cruz Ruiz y Juana Canul-Reich Columnas
Aprendizaje Automático para la determinación de factores que afectan la
calidad del sueño Sapiens Piensa.
Pág. 31 ⇒ Mabel Vázquez Briseño, Arturo Laflor Hernández, Juan Iván Nieto Hipólito, Editorial pág. 2
Christian Navarro Cota y Juan de Dios Sánchez López
La Inteligencia Artificial para Predicción de la Recuperación en la Enferme-
dad Vascular Cerebral
Pág. 37 ⇒ Ruben I. Carino-Escobar y Jessica Cantillo-Negrete e-Tlakuilo pág. 4
Enfoque evolutivo de aprendizaje de máquina en la identificación y control
de sistemas
Pág. 42 ⇒ Alejandro Rodríguez-Molina, Miguel G. Villarreal-Cervantes, Miguel Ángel
Paredes-Rueda y Carlos Alberto Guerrero-León Estado del IArte pág. 6
El aprendizaje de máquina y el modelado de propiedades de materiales
nanoestructurados
Pág. 48 ⇒ Kaled Corona-Romero, M. Fernanda Rosales-De la Cruz, Diego E. Navarro-
López, Edgar R. López-Mena y Gildardo Sánchez-Ante Sakbe pág. 8
Redes Adversarias Generativas: engañando a la inteligencia humana
Pág. 53 ⇒ Leonardo Herrera, Marlen Meza-Sánchez, M.C. Rodríguez-Liñán y Eddie
Clemente
Análisis de Sentimientos en Twitter IA & Educación pág. 85
Pág. 59 José-Clemente Hernández-Hernández, Daniela Juárez-Morales, Juan-José

Guzmán-Landa y Guillermo-de-Jesús Hoyos-Rivera
Importancia de la minería de opinión en redes sociales en español Deskubriendo
Pág. 64 ⇒ Fernando Monroy Tenorio, Janeli Astorga Villela y Aleli Castro Orella
Konocimiento pág. 87
Algunos resultados de control distribuido de múltiples robots
Pág. 68 ⇒ Héctor M. Becerrra, Miguel A. Trujillo, David Gómez Gutiérrez y Javier
Ruiz León
Cómo contar personas usando WiFi y ML
Pág. 73 ⇒ Ramón F. Brena, Edgar Escudero, César Vargas Rosales, Carlos E. Galván
Tejada y David Muñoz
Un paseo por el análisis de señales con wavelets y redes neuronales
Pág. 79 ⇒ Oscar Herrera Alcántara
Año XIV, Vol. II. Mayo - Agosto 2022 Editorial Komputer Sapiens 2 / 88

Sapiens Piensa
Rosa María Valdovinos Rosas
La Inteligencia artificial es un área del conocimiento cu- es la cara que estrategias de inteligencia artificial bus-
yas investigaciones y aportaciones se realizan con impac- can potencializar. Al respecto, en el artículo “Análisis
to en diferentes ámbitos de la vida cotidiana. En este nú- de sentimientos en twitter” los autores describen los
mero de tema libre, gratamente denso de publicaciones, principales aspectos relacionados con el procesamiento
los trabajos que se incluyen atienden diversas temáticas de textos en castellano y las estrategias para la elimi-
de la inteligencia artificial y su incidencia en áreas co- nación de ruido en twitts para análisis de sentimientos e
mo: salud, redes sociales; así como exponer algunos de identificación de tendencias de opinión. Continuando con
los métodos ampliamente utilizados como como las re- la misma tendencia, en el artículo “Importancia de la
des neuronales artificiales, el aprendizaje automático, la minería de opinión en redes sociales en español”
robótica y cómputo evolutivo. los autores explican algunos de los enfoques, aportaciones
La salud es un tema de interés general, con la aplica- y herramientas para extraer la polaridad o clasificación
ción de técnicas de inteligencia artificial se busca propor- de opiniones en redes sociales. Finalmente, en el artículo
cionar estrategias que apoyen al diagnóstico temprano, “Como contar personas usando WiFi y Machine
comportamiento de patologías y/o mejoras en la aten- Learning” los autores presentan un estudio donde se
ción. En este sentido, en el artículo “El aprendizaje de muestra una estrategia de reconocimiento de patrones
máquina y el modelado de propiedades de ma- orientada a identificar grupos de personas y la forma en
teriales nanoestructurados” los autores abordan un que éstos perturban la señal WiFi.
tema de actualidad médica relacionado a la resistencia La robótica es un área que ofrece interesantes pro-
que algunas personas desarrollan a los antibióticos y pro- puestas de solución a diversos problemas reales, en el
ponen la utilización de redes neuronales artificiales para artículo “Robots médicos de punción percutánea
el modelado de las propiedades de materiales nanoes- guiados con resonancia magnética” los autores pre-
tructurados, como alternativa para disminuir lo largo y sentan una revisión de los avances en plataformas robó-
costoso del proceso de estos. Por otro lado, en el artícu- ticas por resonancia magnética para realizar punciones
lo “Escenarios para determinar los estímulos que percutáneas, mostrando las grandes ventajas que su uti-
brindará un asistente tecnológico a una persona lización tiene en términos de acceso y precisión al ser
con deterioro cognitivo” los autores reportan los re- utilizados en extirpación de tejidos. En tanto que en el
sultados obtenidos al utilizar un asistente tecnológico que artículo “Algunos resultados de control distribui-
permite conocer los estímulos de audio y visuales que se do de múltiples robots” los autores muestran algunos
le deben proporcionar a un paciente con deterioro cogni- trabajos en los que se hace uso de sistemas multi-robot
tivo leve para ayudarlo a comer considerando cinco esce- donde cada robot se controla de forma distribuida consi-
narios diferentes. Un estudio semejante es el presentado derando información local logrando evitar colisiones en-
en el artículo “La IA para predicción de la recu- tre ellos.
peración en EVC” . En el artículo “Aprendizaje au- Finalmente, se incluyen algunos artículos que apli-
tomático para la determinación de factores que can técnicas de redes neuronales artificiales y machine
afectan la calidad del sueño” los autores muestran learning para la solución de problemas reales. En el ar-
la utilidad que el aprendizaje automático puede tener al tículo “Redes adversarias generativas: engañando
ser utilizado en la determinación de las actividades que a la inteligencia humana” los autores analizan la ar-
más pueden afectar la calidad del sueño. Por último, en quitectura de las redes adversarias generativas cuando
el artículo “Reglas de asociación para estudiar pa- son utilizadas para generar imágenes falsas a partir de
trones bacterianos involucrados en el desarrollo imágenes reales, describen su funcionamiento y su apli-
de vaginosis bacteriana” los autores explican cómo cación en problemas reales. Por otro lado, en el artículo
los algoritmos de reglas de asociación pueden ser útiles “Un paseo por el análisis de señales con wavelets
para modelar las bacterias que detonan la aparición de la y RNA” los autores revisan conceptos fundamentales
vaginosis bacteriana y pueden ser utilizados en el apoyo del análisis de señales y de las redes convolucionales, in-
diagnóstico de esta enfermedad en mujeres. dicando algunos casos de su aplicación. En el artículo
La comunicación hoy día ha cambiado de forma sus- “De Bigdata al smart data en datos no balancea-
tancial, es casi imposible imaginarla sin las redes sociales. dos con alta dimensionalidad y baja densidad: Un
No obstante, la comunicación y/o difusión de informa- análisis experimental de técnicas de sobremues-
ción a través de redes sociales es sólo una cara de la mo- treo” los autores tocan el tema grandes volúmenes de
neda, el alcance, impacto y el potencial que éstas tienen datos del big data y las estrategias que se pueden uti-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Editorial Komputer Sapiens 3 / 88
lizar para la extracción de conocimiento cuando se tra- los autores describen una metodología que involucra la
baja con datos que presentan desequilibrio de las clases, utilización de metaheurísticas para el control de siste-
alta dimensionalidad y baja densidad. Por último, en el mas complejos y muestran cómo esta estrategia permite
artículo “Enfoque evolutivo de aprendizaje de má- gobernar de forma satisfactoria un sistema dinámico. ✵
quina en la identificación y control de sistemas”

Rosa María Valdovinos Rosas Doctora en Ciencias de la Compu-


tación, miembro del Sistema Nacional de Investigadores Nivel II y de
la AMEXCOMP. Adscrita a la Universidad Autónoma del Estado de
México. Participa en el fortalecimiento y consolidación de la comunidad
científica mediante la formación de recurso humano de calidad, la di-
vulgación del conocimiento y la ciencia en eventos académico-científicos
a nivel nacional e internacional. Además, cuenta con publicación de
artículos científicos en revistas especializadas, capítulos de libro con
editoriales de prestigio y artículos de divulgación.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 4 / 88
e-Tlakuilo: Cartas de nuestros lectores
Karina Figueroa y Rosa María Valdovinos
etlakuilo@komputersapiens.org
En Komputer Sapiens nos hemos esforzado por estar “a comparación social, etc.). Las segundas se enfocan en
sólo un click de distancia” a través de diferentes medios enseñar sobre nutrición y psicología. Finalmente, las ter-
como Facebook, Twitter y correo electrónico. Les pre- ceras, se enfocan en realizar actividad física. Para res-
sentamos algunas de las preguntas que hemos recibido a ponder tu petición, te describiré FoodRateMaster. Este
través de estos medios. videojuego de nutrición se enfoca a enseñar a los niños
que existen diferencias entre los alimentos saludables y
Videojuegos para salud conscientes de la los no saludables y los rangos recomendados para los
personalidad y las emociones de los niños. componentes de la comida: calorías, azúcar, grasa y gra-
sas saturadas. En este juego aparecen alimentos con su
Anónimo – Estudiante de nivel Licenciatura. (vía respectiva información nutricional, y el jugador debe de-
correo electrónico) cidir si mantiene o reduce su consumo. Si decide correc-
tamente reducir un alimento no saludable, el videojuego
Muy interesante su artículo. además le preguntará por cuál alimento lo sustituirá de
El autor, Ismael E. Espinosa Curiel, responde: dos opciones posibles: una saludable y una no saludable.
El que le haya parecido interesante el artículo, nos mo- La cantidad de estrellas que gana el jugador depende
tiva a seguir trabajando y esforzándonos, ¡¡¡Gracias!!! del número de errores. La siguiente imagen muestra la
interfaz principal del videojuego FoodRateMaster.
¿Qué tipo de contenido tiene su juego IFitKids? Actual-
mente, ¿es solo sobre nutrición?.
IFitKids es una plataforma que busca mejorar los hábitos
alimenticios y de ejercicio físico en los niños. Para lograr
lo anterior, IFitKids se basa en tres áreas de conoci-
miento: nutrición, psicología y actividad física. IFitKids
integra tres tipos de minijuegos: a) videojuegos de ejer-
cicio, b) de nutrición, y c) de psicología. Los primeros
se enfocan en que los niños realicen actividad física (ej.
sentadillas, desplantes frontales y laterales, movimientos
de brazos, etc.) para cumplir algún objetivo o misión
dentro del juego. Los segundos se encargan de enseñar-
les sobre la clasificación de alimentos, el plato del buen
comer, las grasas, porciones recomendadas, y alimentos En el siguiente enlace se puede consultar más informa-
saludables y no saludables. Finalmente, los de psicología ción de FoodRateMaster: https://pubmed.ncbi.nlm.
se enfocan en ayudar a los niños a desarrollar habili- nih.gov/32281539/.
dades como el autocontrol (al esfuerzo, a la espera, al
impulso) y el autoconcepto. En total IFitKids integra 24 ¿Cuándo estará disponible para su uso?
minijuegos de los cuales, cinco son para la enseñanza de Dada la naturaleza de la IFitKids, es necesario asegurar-
temas de nutrición (FoodRateMaster, SuperMarketRa- se que la plataforma sea efectiva, fácil de usar, y tenga
ce, FatCombat, DishMaster y HealthyLunch), uno para buena aceptación antes de hacerla disponible para el
la enseñanza de salud integral (HelperFriend), cuatro público. Actualmente, estamos en la fase de desarrollo
para enseñanza y entrenamiento en temas psicológicos y experimentación para probar la efectividad de los mi-
asociados a la nutrición (clínica psicosocial y los juegos nijuegos. Una vez terminada esta actividad, podremos
de autocontrol Stop&Win, Wait&Win, Work&Win ), y probar la efectividad de la plataforma completa. Dado lo
14 de ejercicio (7 alta intensidad y 7 de fuerza). anterior, nuestro plan es liberar los juegos conforme se
vayan probando. Se espera que los primeros minijuegos
¿Podrían dar un ejemplo de una de las actividades/juego estén disponibles al público a finales del 2022 a través
de este módulo? de la tienda playstore.
Las actividades de IFitKids la podemos dividir en tres
grupos. Las primeras se enfocan en motivar el cambio de Y, por último, ¿han pensado en algún módulo de segu-
comportamiento (establecimiento y seguimiento de me- ridad? dada la información que podrían recabar de los
tas, contrato de conducta, retroalimentación de logros, usuarios.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 5 / 88
La versión actual de IFitKids encripta la información de El autor, Juan A Guerrero-Ibáñez, responde:
los niños y de las actividades que estos realizan en la Sí existen otros tipos de interacción cuando hablamos de
plataforma. Pensamos que este nivel de seguridad es su- los coches autónomos. Los hemos estudiado en el gru-
ficiente dada la etapa de desarrollo y experimentación en po con el que publicamos este de KS y esperamos en
que se encuentra el proyecto. Sin embargo, para liberar un futuro cercano tener publicado un paper que estamos
la plataforma al público sí consideramos necesario dise- construyendo sobre el tema.
ñar e implementar mecanismos robustos adicionales para Podemos resumirlo en los siguientes:
mantener la privacidad de los usuarios (ej. seguridad de
dos pasos, o la “tokenización” de la información). Interacción Vehículo a vehículo ( Vehicle-to-
Vehicle, V2V)
¿Cómo los coches autónomos hablarán con las Interacción Vehículo a infraestructura (Vehicle-to-
personas? Infrastructure, V2I)
Anónimo – Estudiante de nivel Licenciatura. (vía Interacción Vehículo con personas (Vehicle-to-
correo electrónico) Human, V2H)
Interacción Vehículo con otros elementos de la ca-
Durante la conducción de un vehículo también hay otro rretera (Vehicle-to-everything, V2X)
tipo de interacción con los otros automóviles, por ejem-
plo, para indicarle que hay un accidente cerca y debe Básicamente con estos modelos de interacción-
bajar la velocidad (en la carretera es común un cambio comunicación se pretende resolver los diferentes retos
de luces). ¿se ha considerado este tipo de interacción en que quedan abiertos en el área, como el planteado en tu
los coches autónomos? mensaje.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 6 / 88

Estado del IArte


Jorge Rafael Gutiérrez Pulido (@jrgpulido) y Reyna Carolina Medina Ramírez
estadoiarte@komputersapiens.org

El web semántico y sus tecnologías: ¿hacia donde vamos?

Inicios Ya han pasado más de 30 años desde la crea- otras técnicas; una empresa está interesada en extraer las
ción de lo que hoy conocemos como el web (WWW). entidades y relaciones necesarias para crear su grafo de
Pero no fue sino hasta una década después, en 2001, conocimiento (vea Figura 1). Eventualmente, un agente
cuando su creador Tim Berners-Lee escribió acerca de de software utiliza dicho grafo para generar nuevo cono-
su idea original, el web semántico1. Éste tiene sus raíces cimiento. Los grafos de conocimiento más conocidos son
en los siguientes conceptos: grafos, bases de datos, redes los de Facebook, Google y Linkedin. Algunos de ellos
semánticas, orientación a objetos, sistemas expertos, y presentes en escándalos muy sonados, como el caso del
representación de conocimiento. El web semántico tiene mal uso que hizo Cambridge Analytica del grafo de co-
la intención de ser proveedor de conocimiento para que nocimiento de Facebook hace algunos años.
los agentes de software, que eventualmente poblarán el
ciberespacio, realicen todo tipo de actividades, hacien- Datos enlazados Son la convergencia entre los datos
do uso de mecanismos de razonamiento e inferencia, a abiertos y las tecnologías semánticas. Los datos abier-
nuestro nombre y para nuestro beneficio. El principio es tos son parte de una iniciativa internacional que nace en
simple, y se basa en el significado de las cosas y sus re- 2011, con 8 países miembros (entre ellos México). Dicha
laciones. iniciativa establece que cualquier individuo puede acce-
der, usar, modificar, y compartir datos, siempre y cuan-
Componentes Las tecnologías semánticas son los do preserven al menos su lugar de origen y apertura.
componentes esenciales del web semántico. Durante las Los datos enlazados son el paso natural en el camino de
útimas tres décadas se realizaron diversos esfuerzos pa- los datos abiertos, pues agregan a éstos tecnologías se-
ra organizar conocimiento, y se desarrollaron diver- mánticas, y con ello los beneficios que esto conlleva. Un
sas tecnologías para hacer ese conocimiento resusable ejemplo de éstos es DBpedia2 , la versión semántica de la
(DAML+OIL). Eventualmente se anclaron las que hoy Wikipedia3 . Actualmente, la nube de datos abiertos en-
conocemos (RFD, SPARQL, OWL), y se han convertido lazados posee 1301 datasets. DBpedia es uno de ellos, y
en la base para nuevos desarrollos, por ejemplo, los grafos hoy en día cuenta con más de 228 millones de entidades.
de conocimiento y los datos enlazados. Además, con el Para saber más4 (en inglés).
objetivo de incluir tecnologías semánticas, en el ámbito
del desarrollo de software se ha creado el UML2 ODM, y ¿Hacia donde vamos? En general, las tecnologías se-
en la industria se ha trabajado en el ISO 15926, partes 8, mánticas están siendo usadas principalmente por los me-
12 y 14. Aunado a esto, se debe mencionar el importan- dios de comunicación, así como por diferentes ámbitos
te rol que han tenido también herramientas tales como de la industria, y el gobierno; lo anterior es con el fin
schema.org, microformats, y opengraph para anotar pá- de manejar sus contenidos, reusar su información, y con
ginas de manera semántica y convertirlas en fuentes de ello recortar costos y optimizar las ganancias. Algunos
conocimiento. ejemplos de éstas son: la BBC, el FT, SpringerNature,
Astra Zeneca, AGFA Healthcare, Cleveland Clinic, entre
Grafos de conocimiento Representan una red de en- otras; y los gobiernos de EUA, Reino Unido, Noruega,
tidades tales como objetos, eventos, y conceptos, así co- Sudáfrica, y Brasil.
mo las relaciones entre éstos. Por ejemplo, mediante pro- En la última década hemos visto un gran incremento
cesamiento de lenguaje natural, minería de datos, entre de aplicaciones que hacen uso de aprendizaje máquina.
1 https://www.scientificamerican.com/article/the-semantic-web
2 http://dbpedia.org/resource/Lemon
3 https://en.wikipedia.org/wiki/Lemon
4 https://lod-cloud.net/#about

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 7 / 88
Ésto puede ser considerado como un renacimiento de las próxima década se espera que haya un renacimiento de
redes neuronales artificiales. De la misma manera, en la la tecnologías semánticas. Lo mejor está por venir. ✵

Figura 1. Grafo de conocimiento, cortesía de https://www.poolparty.biz.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 8 / 88

Sakbe
Laura Gómez Cruz, Laura Cruz Reyes y Claudia Guadalupe Gómez Santillán
sakbe@komputersapiens.org
Aprendiendo idiomas a través de la IA
La Inteligencia Artificial (IA) es una herramienta poderosa y una tecnología que continúa avanzando en el aprendizaje
de idiomas dentro de la educación tradicional. Según la academia de Cambridge, las plataformas de aprendizaje de idio-
mas impulsadas por IA permiten a los estudiantes trabajar a su propio ritmo, repitiendo temas y enfatizando las cosas
con las que tienen problemas, y también permiten que los maestros entiendan y estimen el desempeño del estudiante.
Esas plataformas se basan principalmente en tres pilares:
1. Proporcionar retroalimentación instantánea: conocer puntajes, identificar errores, corregir gramática y
cohesión de ideas.
2. Sin miedo a fallar en público: la IA se enfoca en brindar resultados sin juzgar y los estudiantes tratan sus
errores como desafíos en un juego.
3. Un rol nuevo para los docentes: los docentes se convierten en una guía que utiliza la ciencia y el análisis de
datos para apoyar a los estudiantes.
Según una fuente de IEEE, las siguientes son algunas de las aplicaciones más reconocidas que utilizan IA para la
enseñanza y el aprendizaje de idiomas y el desarrollo de materiales didácticos.

Alphary ⇒ Startup educativa de Austria que a través de


la programación neurolingüística (PNL) acelera el pro-
ceso de adquisición del idioma mediante la aplicación de
IA para el análisis semántico y la retroalimentación auto-
matizada, proporcionando así automáticamente comen-
tarios a los estudiantes y aumentando su participación
con una estrategia de ludificación. Se puede encontrar
en el siguiente enlace:
https://intellias.com/ai-nlp-driven-language-learning-app/
evolucionan en función de los errores cometidos a través
de la repetición espaciada, principalmente de los desa-
fíos más difíciles. El software recopila muchos datos so-
bre el comportamiento de aprendizaje de muchos usua-
rios, construye patrones de memoria, y ajusta las leccio-
nes seleccionando el patrón más afín a las características
personales de cada alumno, entre ellas sus fuerzas y de-
bilidades. Este proceso se optimiza utilizando un motor
Lingvist ⇒ Funciona con Big Data, IA estrecha y apren- de aprendizaje de vocabulario y un motor de aprendiza-
dizaje automático (AU). Lo interesante de esta aplica- je de gramática para generar estadísticas del lenguaje y
ción es que extrae datos de recursos en línea (como ar- gestionar la memoria del estudiante. Se puede encontrar
tículos, subtítulos de películas y libros) y las lecciones en el siguiente enlace:
https://lingvist.com/es/

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 9 / 88
Duolingo ⇒ Además de utilizar IA, AU, repetición espa-
ciada y ludificación para hacer el aprendizaje de idiomas
divertido y atractivo, también anticipa cuándo el usua-
rio olvidará algo que ha aprendido para reforzar su re-
tención. La aplicación utiliza una función conocida como
çerebro de pájaro"para poner ejercicios con base en su
desempeño estimado. Se puede encontrar en el siguiente
enlace:

https://es.duolingo.com
Para saber más de este tema consulta la siguiente IEEE Innovation at work (2020, agosto 28). Impro-
literatura: ve your English with artificial intelligence-powered
apps. https://innovationatwork.ieee.org/
improve-your-english-with-artificial-
Ribeiro, R. (2020, marzo 9). AI in English intelligence-powered-apps/
language learning. World of Better Lear-
ning | Cambridge University Press. https:// Center for data innovation (2017, julio 17). 5 Q’s
www.cambridge.org/elt/blog/2020/03/09/ for Mait Müntel, Co-Founder of Lingvist.https://
artificial-intelligence-english-language- datainnovation.org/2017/07/5qs-for-mait-
learning/ muntel-co-founder-of-lingvist/

Juan Pérez

Start

Progress

50

40

30

20

10

0
Grammar Spelling Listening Elemento 5

Aprende idiomas con la IA .

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 10 / 88
ARTÍCULO ACEPTADO
Escenarios para determinar los estímulos que
brindará un asistente tecnológico a una persona con
deterioro cognitivo
Victor M. Montaño Serrano, Juan Manuel Jacinto Villegas, Adriana H. Vilchis González y Otniel
Portillo Rodríguez
Introducción tar la comprensión de los requisitos tecnológicos para la
Las personas con deterioro cognitivo leve pueden ser con- toma de decisiones. El modelo se enfoca en las tareas crí-
sideradas como discapacitadas, y debido a su baja acti- ticas para realizar una intervención cuando el desempeño
vad física y condición intelectual presentan problemas cognitivo de una persona falla. Posteriormente se realiza
para realizar actividades de la vida diaria (ADL por sus una propuesta basada en las capacidades cognitivas y el
siglas en inglés, Activities of Daily Living ), por lo que nivel de soporte que se requiere.
requieren de ayuda permanente de una persona o de un Además, para desarrollar la propuesta de los esce-
asistente para poder completarlas [1]. narios se emplearon las recomendaciones de diseño de
Normalmente, quienes ofrecen ayuda al paciente son interfaces y dispositivos para personas con MCI propues-
los familiares que viven con él. En la mayoría de los ca- tas en [6]; las cuales indican que las interfaces que se van
sos, una sola persona es la que asume toda la respon- a utilizar deben seguir las siguientes recomendaciones:
sabilidad en sus cuidados; quien al ser sometida a una a) contener solo la información necesaria para no dis-
sobrecarga en los trabajos de cuidado puede tener un traer a los usuarios de la idea que se quiere transmitir;
impacto negativo, dando lugar a una condición conocida b) los colores deben ser de alto contraste; y c) los ico-
como síndrome del cuidador[2]. Debido a lo anterior, en nos y sonidos que se usan deben de ser familiares para
la actualidad diversos grupos de investigación han de- las personas. De manera que, se ha propuesto una serie
sarrollado asistentes, con los cuales intentan reducir la escenarios para que un asistente tecnológico (TA por
carga de trabajo de los cuidadores y al mismo tiempo sus siglas en inglés, Technical Assistant ) pueda proveer
apoyar a los pacientes en sus ADLs. mediante una pantalla y bocinas, diferentes estímulos a
El presente artículo explica una serie de escenarios un paciente con MCI durante la actividad de comer.
propuestos para el desarrollo de un Asistente Tecnoló-
gico para ayudar a un paciente con deterioro cognitivo Metodología
leve (MCI por sus siglas en inglés, Mild Cognitive Im- El paciente para el cual se está diseñando el Asistente
pairment ) en la actividad de comer; actividad que fue Tecnológico es un hombre de 56 años. Después de que
determinada en la tesis de maestría [3]. De igual ma- presentó un evento cerebro vascular se le realizó un es-
nera, este artículo sienta las bases para el desarrollo de tudio neuropsicológico, donde se concluyó que exhibe los
un asistente que empleará visión por computadora para siguientes problemas: un trastorno neurocognitivo ma-
detectar la actividad y realizar intervenciones para que yor de severidad moderada que reduce la capacidad para
corregir al paciente. realizar sus ADL’s, alteraciones del lenguaje compatibles
Para el desarrollo de los escenarios se emplearon las con un síndrome afásico, déficit en las funciones ejecuti-
recomendaciones del diseño centrado en el usuario [4], vas, atención sostenida y selectiva, problemas de memo-
que indican que los usuarios deben de participar en las ria visual, así como en las habilidades visoespaciales y las
etapas diseño y desarrollo de nuevos productos. También funciones ejecutivas. Adicionalmente, en [3] se especifica
se usó del modelo CTA-DCD (Cognitive Task Analysis que la actividad de comer es prioridad, ya que es en la
/Decision-Centered Design ) propuesto en [5] para el de- cual el cuidador asiste al paciente con mayor frecuencia.
sarrollo de tecnología de personas con MCI. En [3] se describe que el paciente tiene “días buenos”,
El modelo CTA indica que para llevar a cabo un desa- que se caracterizan porque puede realizar actividades con
rrollo tecnológico se deben conocer las capacidades cog- ayuda de un cuidador quien le proporciona instrucciones
nitivas de una persona y los estímulos a los que reac- y le ayuda a mantener la atención para finalizar la acti-
ciona. Lo anterior se emplea para realizar un análisis de vidad. Adicionalmente, presenta “días malos”, donde los
los aspectos sociales (relacionados con los humanos) y problemas se vuelven constantes y le dificultan el poder
tecnológicos (no humanos) que interactúan entre sí para hacer cualquier actividad, las instrucciones del cuidador
perseguir un objetivo común. El modelo DCD consiste no son suficientes y requiere de que lo apoyen físicamente
en el análisis, diseño y evaluación de tareas para facili- para terminar las actividades. La frecuencia con la que

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 11 / 88
se presentan los “días malos” son de una o dos veces al una imagen correspondiente a la intervención del cuida-
mes. dor; si el paciente cambia su comportamiento, el monitor
Para realizar los escenarios, se emplearon dos habi- regresa a desplegar el color negro.
taciones: a) la del paciente, donde se llevó a cabo la ac- Para llamar la atención del paciente, se implemen-
tividad de comer, y b) la de control, donde se realizó el tó una alarma sonora que acompañaba el cambio de las
monitoreo al paciente. Los elementos tecnológicos que se imágenes durante las intervenciones. Se eligió un sonido
®
emplearon fueron: un monitor DELL de 19 pulgadas de guitarra, ya que el paciente, antes de adquirir MCI,
®
de 1.280 x 1.024 píxeles, una bocina HP de 5w tipo tocaba este instrumento musical.
barra, un micrófono genérico, una cámara web de 1080p En cuanto a las instrucciones orales, se proporcio-
HD usb 2.0 y dos computadoras portátiles MacBookPro naron de tres formas diferentes. La primera, a la cual
con MacOS 11.5, 8GB en RAM y procesador Intel Core se le denominará como pregrabada, consta de una serie
i5. de grabaciones de la voz del cuidador con las siguientes
Con base en las recomendaciones descritas para desa- instrucciones: a) acerca el plato para comer, b) usa un
rrollar tecnología para personas con MCI, se elaboraron tenedor o una cuchara, c) recuerda como se usa el tene-
elementos de intervención para llamar la atención del dor o la cuchara, d) no comas agachado, e) ya no hay
paciente y corregir su comportamiento durante la acti- comida, f) come despacio y g) siéntate en el lugar de
vidad de comer tal como si estuviera el cuidador en la comer. La segunda, que se identificará como natural ; a
misma habitación. A continuación se describen las inter- través de un micrófono el cuidador da las instrucciones
venciones que se seleccionaron para ser evaluadas. de manera natural, mientras observa al paciente a través
del monitor. La tercera, que se nombrará como grabación
Elementos de intervención natural, es un compilado de instrucciones grabadas de la
La Figura 1 muestra las nueve imágenes usadas para des- interacción natural del cuidador con el paciente.
cribir visualmente las instrucciones que el cuidador repite Estos elementos de intervención se utilizaron de ma-
constantemente al paciente para ayudarlo en la actividad nera alternada durante los escenarios. A continuación se
de comer; a) usar cuchara para comida líquida; b) usar describe a detalle cada uno de estos. Como se puede ver
el tenedor para la comida sólida; c) indicar al paciente en las Figuras 2-6; el cuarto del paciente se encuentra
que debe masticar la comida; d) recordar como usar la dividido con una línea punteada, la cual representa que
cuchara; e) recordar como usar el tenedor; f) que se apo- los dispositivos se han colocado una distancia de 1.70 cm
ye de los cubiertos para recoger la comida; g) recordarle del paciente. En ningún momento hay otra persona con
cual es la postura para comer; h) indicarle que ya no hay él en su cuarto, ya que las intervenciones las realizaron
comida en el plato; i) acomodar la comida dentro del un cuidador y un monitor desde el cuarto de control, que
plato. está contiguo al del paciente.
Escenario 1
La Figura 2 muestra el escenario 1; en el cual se utilizaron
los siguientes elementos: cámara, bocina y computado-
ra. Las intervenciones utilizadas fueron instrucciones
pregrabadas, que eran reproducidas por el operador ma-
nualmente desde la computadora 1 cuando observaba
que el paciente tenía un comportamiento que debía ser
corregido.
Escenario 2
En la Figura 3 se representa el escenario 2, que consta
de los siguientes elementos: cámara, bocina, micrófono y
una computadora. Las intervenciones utilizadas: instruc-
Figura 1. Imágenes utilizadas para ejemplificar y apoyar las ciones por parte del cuidador mediante el micrófono de
instrucciones que el cuidador le indica al paciente durante los manera natural. La participación del operador se limitó
escenarios. a motivar al cuidador para seguir interactuando con el
Las imágenes de la Figura 1 tienen un alto contraste paciente a través del la computadora 1 y el micrófono. A
con el fondo, además no se incluyen más elementos que diferencia con las instrucciones pregrabadas, el cuidador
puedan distraer al paciente de la idea que se le quiere puede decir una misma instrucción de diferentes mane-
transmitir. El monitor utilizado para desplegar las imá- ras. También, puede modular el volumen de su voz para
genes permanece en color negro hasta que se selecciona llamar la atención del paciente.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 12 / 88

Figura 4. Diagrama del escenario 3 con interacción natural


Figura 2. Escenario 1 con instrucciones pregrabadas. e imágenes.

Figura 5. Diagrama del escenario 4 con interacción natural


del cuidador, imágenes y una alarma.

Figura 3. Escenario 2 con intervención natural del cuidador. Escenario 5


Finalmente, la Figura 6 muestra el escenario 5. Los ele-
Escenario 3 mentos utilizados fueron: cámara, bocina y una compu-
El escenario 3 se ilustra en la Figura 4. En esta ocasión tadora. Las intervenciones empleadas fueron instruccio-
los elementos tecnológicos usados fueron: cámara, boci- nes grabadas de manera natural de la voz del cuidador.
na, micrófono, monitor y dos computadoras. Las inter- Por lo tanto, las grabaciones se obtuvieron de la inter-
venciones utilizadas fueron: las imágenes, la alarma y las acción del cuidador con el paciente, lo que permitió ex-
instrucciones de manera natural. Durante este escenario, traer diferentes instrucciones para el mismo comporta-
el cuidador le daba las instrucciones por el micrófono al miento, así como diferentes tonos de voz, y un sonido de
paciente mientras lo observaba en la computadora 2 a la voz no mecanizado. Las instrucciones grabadas son las
través de la cámara. Mientras que, desde la computadora siguientes: a)“acomoda la comida”, b)“acomoda la me-
1, el operador apoyaba al cuidador para cambiar las imá- sa”, c)“come con la cuchara”, d)“come con el tenedor”,
genes en el monitor cada que se le daba una instrucción e)“deja los cubiertos”, f)“despacio”, g)“coloca la toalla”,
al paciente. h)“junta la comida”, i)“mastica bien”, j)“no te empines”,
k)“no metas la mano”, l)“decir el nombre del paciente”,
m)“siéntate”, n)“toma el agua”, o)“ya no tiene”, p)“ya ter-
Escenario 4 minaste”. La participación del operador se enfocó a moni-
Por otro lado, en la Figura 5 se muestra el escenario 4, torear al paciente y reproducir las grabaciones utilizando
donde los elementos tecnológicos son los mismo que se ®
el software de edición de audio “GarageBand ” a tra-
utilizaron en el escenario 3. En cuanto a las interven- vés de la computadora 1. En cuanto al cuidador, se ha
ciones utilizadas, el cuidador le indicaba al paciente las sustituido por las grabaciones.
instrucciones por medio del micrófono mientras lo ob- Este último escenario, representa al asistente tecnoló-
servaba desde la computadora 1. Además, se agregó la gico que se propone en [3], en donde se propone reducir la
alarma sonora que se activaba cada que el operador cam- intervención del cuidador, en este caso, a través de la im-
biaba las imágenes en el monitor desde la computadora plementación de mensajes de voz grabados para brindar
1. Adicionalmente, se le subió el volumen a la bocina pa- instrucciones. En la sección de resultados se exponen las
ra asegurar que el paciente escuchara la voz del cuidador razones por las cuales los escenarios presentados ayudan
y la alarma. o no al paciente durante la actividad de comer.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 13 / 88
con el monitor, se comportó indiferente al sonido. El vo-
lumen con el que se reproducía la voz y la alarma no
fueron molestos para el paciente ya que tampoco realizó
ninguna acción para bajar el volumen o apagar la bocina
al principio, durante, o al final de la actividad de comer.
El tiempo que tarda el paciente en modificar su com-
portamiento en la interacción natural del cuidador con el
paciente es menor respecto a la interacción pregrabada.
Esto se debe a que el cuidador puede moderar el volumen
de su voz, de manera que si el paciente no atiende una
instrucción, el mensaje puede cambiar, tanto en el tono
Figura 6. Diagrama del escenario 5 con instrucciones graba- como en su contenido.
das extraídas de la interacción entre el cuidador y el paciente.
Tabla 2. Ventajas y desventajas de los escenarios.
Resultados EscenarioVentajas Desventajas
Las pruebas se llevaron a cabo durante siete “días bue- 1 La voz del cuidador es Las voces pregrabadas
nos”; esto significa que el paciente podía reconocer la conocida para el pacien- se escuchan mecaniza-
persona que le estaba hablando desde un micrófono. Ade- te das. El tiempo para
más, respondía cuando se le hacían preguntas simples. De seleccionar las graba-
igual manera el paciente sabe que tiene un monitor fren- ciones y repetirlas no
te a él y que sirve para ver imágenes o vídeos, también, es continuo. Grabacio-
es consciente que está siendo grabado con una cámara y nes insuficientes
2 La retroalimentación es El cuidador quiere in-
reconoce el dispositivo. No fue necesario realizar un es- en tiempo real y conti- teractuar de otra forma
cenario en “días malos”; ya que se sabe que en estos días nua. La voz del cuidador con el paciente e inte-
el paciente no sigue las instrucciones del cuidar, incluso es natural. Diálogos uti- rrumpe las instrucciones
requiere de apoyo físico para completar sus ADL‘s. lizados por el cuidador que le da.
con el paciente son na-
Tabla 1. Comparación entre los escenarios. turales.
Comportamiento del paciente Escenario 3 La retroalimentación es El video no afecta el
1 2 3 4 5 en tiempo real y conti- comportamiento del pa-
Atención a la voz Sí Sí Sí Sí Sí nua. La voz del cuidador ciente
Atención al vídeo NA NA No No NA es natural.
Atención a la alarma NA NA NA No NA 4 Se usa el sonido de una El sonido de guitarra no
Corrige el comportamiento Sí Sí Sí Sí Sí guitarra ya que es cono- llama la atención del pa-
Corrige el comportamiento No Sí Sí Sí Sí cido para el paciente. ciente
instantáneamente 5 Voz natural del cuida- El tiempo de respuesta
No aplica (NA), se refiere a que no se puede verificar el cambio de dor. Diálogos utilizados del paciente aumenta a
comportamiento durante el escenario; Sí/No, indica que el por el cuidador con el diferencia del escenario
paciente presenta o no el comportamiento. paciente son naturales. 2 y 3, pero no tarda tan-
to como con el escenario
En la Tabla 1 se presenta un resumen de las respues- 1.
tas que el paciente tuvo ante los estímulos recibidos en
los cinco escenarios, se puede observar que el paciente sí La Tabla 2 muestra una comparación entre las ven-
presta atención a la voz del cuidador y que al escuchar- tajas y desventajas de los escenarios. Donde se puede
la cambia su comportamiento. Por otro lado, el paciente observar que la voz natural del cuidador es el estímulo
en ningún momento le puso atención a las imágenes que al cual el paciente responde de mejor manera (escenario
se mostraron en el monitor; este comportamiento lo pre- 2). También muestra que el sistema debe de brindar la
sentó cuando las imágenes estaban solas y cuando iban retroalimentación en tiempo real y de manera repetida,
acompañadas por el sonido de la alarma. Una vez que ya que el paciente requiere ser estimulado continuamente
empezó con la actividad de comer no volteó a ver el mo- para poder cambiar su comportamiento (escenario 5).
nitor, su desdén hacia el dispositivo se reflejó en que ni Con el escenario 5, el cuidador se mostró sorprendido
hizo el intento por apagarlo. al ver que el paciente puede corregir su comportamiento
En cuanto a la voz emitida por la bocina, el pacien- únicamente escuchando su voz. Esta es una ventaja, ya
te se mostró atento, y dicho estímulo fue suficiente para que el cuidador puede presentar fatiga cuando debe de
que corrigiera su comportamiento. Por otro lado, la alar- repetir las instrucciones y por momentos la motivación
ma no causó ninguna reacción del paciente. Al igual que que le provee al paciente se ve interrumpida.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 14 / 88
Con un asistente implementado, tal como en el es-
cenario 5, se pudiera ayudar al paciente en la actividad Conclusiones
de comer. Sin embargo, éste no sería de utilidad en un Gracias a los 5 escenarios implementados se obtuvieron
“día malo”, ya que es necesario realizar una intervención las siguientes conclusiones que deben tomarse en cuenta
física para retirar la comida y quitarle los cubiertos al para el desarrollo del TA. En primer lugar, el asistente
paciente. Por lo que para llamar su atención y cambiar podría ayudar al cuidado del paciente durante la activi-
su comportamiento, podría ser necesario una interacción dad de comer. Aún cuando el paciente tiene “días malos”,
física entre el TA y el paciente, característica que no esta éstos no son tan recurrentes, ya que se presentar una o
considerada en el desarrollo del asistente por el momen- dos veces al mes. Por lo tanto, el TA puede ayudar a una
to. persona durante la actividad de comer. Lo que conduce
Durante las pruebas con los escenarios, las instruc- a que el asistente pueda ser implementado mediante la
ciones que se repitieron con una frecuencia mayor a 20 metodología propuesta para modificar el comportamien-
´´
veces son las siguientes: “mastica bien”, no te empi- to del paciente y apoyarlo durante la actividad de comer.
nes”, “acomoda la comida” y decir su nombre. Con una Por lo tanto, se puede continuar con el desarrollo de un
frecuencia entre 15 y 20 veces se presenta: “come con la TA que empleará visión por computadora para sustituir
cuchara”, “come con el tenedor”, “come despacio”, “junta los elementos que se encuentran en el cuarto de control
la comida”, “no metas la mano”. Las instrucciones que se con un software que realice el trabajo de monitorear al
repiten con una frecuencia menor a 10 veces son: “aco- paciente durante la actividad de comer.
moda la mesa”, “deja los cubiertos”, “coloca la toalla”, De igual manera, el paciente en un “día malo” pre-
“siéntate”, “toma el agua”, “ya no tiene”, “ya terminaste”. senta características de personas con deterioro cognitivo
severo que no permiten el uso del asistente debido a que
Discusiones requiere de ayuda física del cuidador para completar la
La automatización de los escenarios descritos pueden actividad de comer. Es por esto que no se recomienda el
apoyar a una persona con MCI durante la actividad de uso del TA para personas con deterioro cognitivo severo.
comer, apoyando también al cuidador debido a que su Por otro lado, los escenarios mostraron que no se re-
carga de trabajo realizada sería menor. quiere la retroalimentación visual (imágenes de correc-
La aplicación del modelo CTA-DCD [5], junto con las ción) ya que el paciente no puso atención al monitor
recomendaciones para el diseño de interfaces para perso- durante los experimentos realizados. Eso simplifica los
nas con MCI [6], permitió el desarrollo y selección de los requerimientos tecnológicos que se requieren para la in-
elementos de intervención para un TA. La metodología teracción entre el asistente y el paciente.
que se presenta en el artículo es similar a la del diseño Adicionalmente, los mensajes de voz con las instruc-
centrado en el usuario [4]. Sin embargo, debido a que ciones que se emplearán, deben ser grabados directamen-
permiten involucrar a usuarios con MCI durante la eta- te de la interacción entre el cuidador y el paciente para
pa de desarrollo, la tecnología se seleccionó tomando en que el segundo corrija su comportamiento y mantenga su
cuenta las capacidades cognitivas del usuario. atención durante la actividad. Sin embargo, la voz gra-
De la misma manera, se puede indicar que para de- bada del cuidador no debe de escucharse mecanizada,
sarrollar este asistente, se requieren los elementos tecno- debe ser de manera natural, por lo tanto, los mensajes
lógicos y de intervención presentados en el escenario 5 no deben ser leídos; para lo cual, en este experimento
(ver Figura 6). Para identificar que instrucción debe ser se demostró que deben de ser extraídos de una graba-
generada por el TA, es necesario el desarrollo de módulos ción cuando se lleva a cabo la interacción entre el cui-
con algoritmos basados en visión por computadora. dador y el paciente. De esta manera, se pueden obtener
Además, el desarrollo de tecnología para apoyar a los más mensajes con instrucciones diferentes para un mis-
cuidadores y pacientes con MCI es de suma importancia, mo comportamiento.
ya que según, el INEGI en 2019 [7], en México hay ca- Por último, se sugiere utilizar la voz del cuidador
si 7.7 millones de personas con una discapacidad, de las para grabar los mensajes ya que, como se indica en las
cuáles, el 11.8 % son personas que tiene una discapacidad recomendaciones para el desarrollo de tecnología para
relacionada a problemas mentales, como lo es el MCI. personas con MCI [6], los estímulos que se transmiten a
Aunque en la literatura se pueden encontrar auto- los pacientes deben ser conocidos, debido a sus condicio-
res que reconocen actividades mediante la visión por nes si se usa la voz de una persona diferente, el paciente
computadora por medio de la postura [8], relacionando podría no hacer caso.✵
el objeto que sujetan [9], e incluso mediante un robot
[10], no se ha encontrado un TA que sea capaz de ofrecer
una retroalimentación auditiva para corregir al usuario REFERENCIAS
al realizar una actividad de la vida diaria de manera 1. Edwards, R.D., et al. (2020). Difficulty and help with activities
of daily living among older adults living alone with cognitive
correcta. impairment. Alzheimer’s & Dementia, 16(8), 1125-1133.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 15 / 88
2. Pérez Rodríguez, M., et al. (2017). El síndrome del cuidador ment and dementia. A systematic review. Frontiers in psycho-
en cuidadores principales de ancianos con demencia Alzhéimer. logy, 11, 648.
Gaceta Médica Espirituana, 19(1), 38-50.
7. INEGI. (2019). Estadísticas a propósito del día internacio-
3. Montaño Serrano, V. M. (2020). Propuesta conceptual de un sis- nal de las personas con discapacidad. Recuperado el 3 de
tema de asistencia tecnológica para un paciente con deterioro diciembre de 2019, de https://www.inegi.org.mx/contenidos/
cognitivo leve: Un caso de estudio. Tesis de maestría, Maestría saladeprensa/aproposito/2019/discapacidad2019_nal.pdf.
en Ciencias de la Ingeniería. Universidad Autónoma del Estado
de México. 8. Rodríguez-Moreno, I., et al. (2020). Shedding light on people
4. Still, B., y Crane, K. (2017). Fundamentals of user-centered action recognition in social robotics by means of common spa-
design: A practical approach. CRC press. ISBN 978-131-520- tial patterns. Sensors, 20(8), 2436.
092-7, 347. 9. Kostavelis, I., et al. (2019). Understanding of human behavior
5. Shastri, K. (2019). Exploring the requirements for technology with a robotic agent through daily activity analysis. Interna-
design to support people with mci or early-onset dementia at tional Journal of Social Robotics, 11(3), 437-462.
work. Tesis de maestría, Master of Applied Science in Systems
Design Engineering. University of Waterloo. 10. Riva, G., y Riva, E. (2019). RAMCIP: An Advanced Social Ro-
bot for Providing Assistance at Home to Older People in Need.
6. Irazoki, E., et al. (2020). Technologies for cognitive training and Cyberpsychology, Behavior, and Social Networking, 22(7),
cognitive rehabilitation for people with mild cognitive impair- 510-511.

SOBRE LOS AUTORES

Victor M. Montaño Serrano obtuvo el grado de Ingeniero en Computación en 2015, y el grado de


Maestro en Ciencias de la Ingeniería en 2019 por la Universidad Autónoma del Estado de México. Ac-
tualmente es profesor de asignatura en la misma universidad. Sus intereses científicos incluyen robótica
de asistencia, visión por computadora, interacción humano-robot, automatización, robótica educativa
y desarrollo de aplicaciones.
Juan Manuel Jacinto Villegas obtuvo el grado de Ingeniero en Electrónica, y Maestro (con hono-
res) en Ingeniería Electrónica, por el Instituto Tecnológico de Orizaba en 2010 y 2012, respectivamente.
En 2017, obtuvo el grado de Doctor (con honores) en Tecnologías Digitales Emergentes en el área de
investigación de Robótica Perceptual de la Scuola Superiore Sant’Anna, Pisa, Italia. Desde el 2018
es Profesor Investigador del programa Cátedras CONACYT, ahora llamado “Investigadoras e Investi-
gadores por México” del CONACYT, con la Facultad de Ingeniería de la Universidad Autónoma del
Estado de México (UAEM), Toluca, México. Sus áreas de intereses incluyen robótica, control háptico,
interacción humano-robot, electrónica, mecatrónica y automatización.

Adriana H. Vilchis González obtuvo el grado de Doctora en Imagen, Visión y Robótica en el


Instituto Nacional Politécnico de Grenoble, Francia. Actualmente es profesora e investigadora en las
Facultades de Ingeniería y de Medicina de la Universidad Autónoma del Estado de México. Sus intereses
científicos incluyen Robótica Médica y Sistemas Mecatrónicos.

Otniel Portillo Rodríguez obtuvo el grado en Ingeniería Electrónica en el Instituto Tecnológico de


Toluca en el año 2000. En 2002, obtuvo el grado de Maestro en Sistemas Electrónicos por el Instituto
Tecnológico de Estudios Superiores de Monterrey Campus Toluca. En 2008, le fue concedido el grado
de Doctor en Robótica Perceptual por la Scuola Superiore Sant’Anna, Pisa, Italia. Actualmente, es
profesor de tiempo completo asociado a las facultades de Ingeniería y Medicina de la Universidad
Autónoma del Estado de México. Apoya a los programas de maestría y doctorado en ingeniería de dicha
facultad (ambos pertenecientes al PNPC). En la facultad de medicina está asociado a la licenciatura
en Bioingeniería Médica. Sus áreas de interés incluyen: machine learning, dispositivos mecatrónicos,
procesamiento de señales e imágenes.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 16 / 88
ARTÍCULO ACEPTADO
Robots médicos de punción percutánea compatibles
con resonancia magnética
Isis Danae Sánchez Hernández, Adriana Herlinda Vilchis González y Juan Carlos Ávila Vilchis
Introducción es el caso de la cirugía robótica en combinación con es-
El estudio de Resonancia Magnética (RM) es la tecnolo- tudios imagenológicos como la RM. Bajo este esquema,
gía médica diagnóstica de imágenes más apropiada pa- las capacidades de la resonancia magnética han mejo-
ra la visualización de tejidos blandos. La RM produce rado para permitir intervenciones con aguja dentro del
imágenes anatómicas tridimensionales detalladas de ex- equipo de RM, donde un médico puede seleccionar un
celente calidad, es capaz de detectar cambios pequeños objetivo e introducir una aguja a través de la piel en
en estructuras anatómicas y ofrecer contrastes elevados estructuras anatómicas específicas, como articulaciones
útiles para la diferenciación de tejidos. A diferencia de o raíces nerviosas para inyectar un agente de contraste
otros estudios como los rayos X o la tomografía compu- o un analgésico. El médico también puede llegar a dife-
tarizada, la RM no expone a los pacientes ni al personal rentes órganos internos, como la próstata, la mama, el
médico a radiación ionizante, que es potencialmente da- hígado o el cerebro para realizar una biopsia y apuntar
ñina para el ser humano. a las lesiones cancerosas con procedimientos de ablación
La RM emplea imanes que producen un potente cam- con aguja para quemar o congelar las células malignas.
po magnético que, en conjunto con ondas de radiofre- Se han desarrollado diversos dispositivos e incluso agujas
cuencia generadas mediante una computadora, crean las de materiales que han demostrado no presentar suscep-
imágenes detalladas de los órganos y tejidos del cuer- tibilidad ante el campo magnético generado por la RM y
po. Aunque la RM no emite radiación ionizante dañina que son compatibles con el estudio, como pueden ser el
para el ser humano, el campo magnético que produce Titanio, aleaciones de Cromo-Cobalto, Cobre e incluso
se extiende más allá de la máquina y ejerce fuerzas de acero inoxidable [2].
atracción sobre objetos de hierro, algunos aceros y otros La aplicabilidad de los sistemas robóticos en proce-
objetos magnetizables. Por lo mencionado, la RM está dimientos quirúrgicos ha quedado demostrada en proce-
contraindicada en presencia de materiales que pueden dimientos complejos, mejorando la precisión en los mo-
ser afectados por los campos magnéticos potentes. Estos vimientos del médico, reduciendo el tiempo de conva-
materiales incluyen: (1) metales ferromagnéticos; (2) dis- lecencia y de pérdida sanguínea y permitiendo realizar
positivos médicos magnéticamente activados o controla- operaciones a distancia; todo ello con un bajo índice de
dos electrónicamente (como marcapasos, desfibriladores errores y escasas complicaciones presentadas [3]. A su
cardioversores implantables e implantes cocleares); y (3) vez, se logra ampliar la utilidad de la RM, pasando de
cables eléctricos o materiales no ferromagnéticos como ser exclusivamente un método de diagnóstico a ser parte
cables de marcapasos y ciertos catéteres [1]. de la intervención quirúrgica.
El campo magnético de la RM es muy fuerte y pue- A continuación, se presenta una revisión del avance
de estar siempre activo. Así, un objeto ferromagnético de plataformas robóticas guiadas por RM para realizar
(tanques de oxígeno, postes de metal, o cualquier otro) la tarea de punción percutánea en tejidos de interés.
en la entrada de la sala de exploración puede ser atraído
por el imán a alta velocidad y ocasionar un accidente.
La única manera de separar el objeto del imán puede ser Robots de punción compatibles con RM
desactivar (anular) el campo magnético [1]. Se realizó una revisión de las plataformas robóticas com-
Algunas de las aplicaciones de la RM son el diag- patibles con RM desarrolladas en los últimos años, tan-
nóstico, investigación y análisis de anomalías, tumores, to experimentales como comerciales. En las secciones si-
quistes, y lesiones en diferentes estructuras anatómicas guientes, se hace un compendio de las principales apli-
del cuerpo. Debido al avance de robots médicos en tér- caciones de dichos robots, primeramente, divididos por
minos de tecnología, investigación y desarrollo, muchos el tipo de robótica empleada (robótica rígida o robótica
campos de la medicina se han visto positivamente im- suave) y subdividida de acuerdo con la región anatómica
pactados con la introducción de sistemas robóticos, como para la que el robot tiene aplicación.

Los robots médicos compatibles con resonancia magnética son capaces de


mejorar los procedimientos quirúrgicos actuales.
© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691
Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 17 / 88
I. Principales aplicaciones de la robótica guia- la limitación de espacio del orificio del escáner.
da por RM Este sistema robótico permite acceder al área
Las siguientes subsecciones se enfocan en los sis- de la mama desde un costado del paciente. El
temas robóticos tanto rígidos como suaves de RM cirujano elige un punto de objetivo en las imá-
para intervenciones con aguja. Los sistemas de ro- genes de RM y el sistema robótico calcula la
bótica rígida se comentan para cuatro categorías: navegación de la aguja, visualiza la trayecto-
(a) diagnóstico e intervención de cáncer de mama; ria de la aguja y conduce automáticamente la
(b) biopsias de próstata y braquiterapia; (c) biop- aguja que es flexible en una trayectoria cur-
sia e intervenciones neuronales y (d) otras aplica- va hacia el objetivo. Los estudios en fantoma
ciones guiadas por RM con aguja. Las aplicaciones (material que simula el tejido humano) mos-
de los robots suaves se especifican en su respectiva traron una precisión de 0,8 mm para localizar
sección. la punta de la aguja.
En la Universidad de Twente, se desarrolló
II. Robots rígidos Stormram 4 [5], un sistema robótico novedo-
El manipulador industrial común, es un ejemplo so y compacto de 4 GDL impreso en plástico.
de robot rígido, el cual forma una cadena cinemá- Stormram 4 utiliza motores paso a paso neu-
tica de varios grados de libertad, constituido por máticos lineales y un motor paso a paso neu-
eslabones y articulaciones. Siendo estructuras con mático curvo de reciente desarrollo. Este ro-
muy poca capacidad de deformación elástica, las bot muestra una precisión posicional de 0,71,
articulaciones permiten el movimiento relativo en- 0,2 y 0,21 mm en las direcciones X, Y y Z,
tre eslabones consecutivos gracias a un sistema de respectivamente. Tiene el objetivo de realizar
actuación y de transmisión que está acoplado a ca- extracción de tejido (biopsias) durante la ex-
da eslabón. ploración de la mama por RM de una forma
más precisa.
a. Diagnóstico e intervención de cáncer de b. Biopsias de próstata y braquiterapia
mama El cáncer de próstata fue en 2020, el cuar-
El cáncer de mama es el tipo de cáncer más to cáncer que presentó más casos nuevos en
común, en 2020 se presentaron más de 2,2 mi- el mundo con un total de 1.41 millones de ca-
llones de casos y produjo la muerte de alrede- sos nuevos. Una de las principales aplicaciones
dor de 685,000 mujeres, posicionándose como de los sistemas robóticos compatibles con RM
la primera causa de muerte en mujeres a nivel es la braquiterapia y biopsias de próstata. La
mundial. Una estrategia útil para contrarres- primera prueba en humanos usando un siste-
tar las elevadas cifras de letalidad que ocasio- ma robótico intraoperativo guiado por RM fue
na esta enfermedad es su detección y trata- reportado por Bosch en un paciente [2]. Este
miento en sus fases iniciales, para lograr esto sistema posee 5 GDL ajustables manualmente
es necesario contar con procedimientos y dis- y uno para la aguja de inserción automática
positivos que brinden diagnósticos oportunos con precisión de menos de 1mm.
[4]. Ball [6], usó un robot con 6 GDL llamado Mr-
La RM es altamente sensible a las lesiones del Bot que fue aprobado para realizar pruebas
cáncer de mama, proporcionando una tasa de humanas. Cinco hombres con una edad media
detección de alrededor del 90Larson [2], desa- de 66 años se sometieron a biopsia con Mr-
rrolló el primer dispositivo robótico de inter- Bot, donde para 30 pruebas de biopsias, se
venciones con RM interactivas para mamas informó una precisión de focalización de 2,55
en Estados Unidos. A partir de ese momento, mm, sin correcciones de trayectoria ni inten-
se han reportado algunos nuevos sistemas en tos fallidos. Todos los pacientes toleraron bien
la literatura. Yang [2], utilizó cilindros neu- el procedimiento. En MrBot, se usaron moto-
máticos para desarrollar un sistema maestro- res PneuStep (Motor Neumático a Pasos de
esclavo para biopsias de mamas trabajando en material dieléctrico no magnético) que pro-
RM. Este sistema cuenta con 6 Grados de Li- porcionan una actuación neumática diseñada
bertad (GDL), uno de ellos acciona la punción especialmente para esta aplicación. MIRIAM
de la aguja. es un sistema robótico para intervenciones de
Park [4], desarrolló un sistema robótico auto- cáncer de próstata, que se encuentra en fa-
mático de intervención con aguja flexible para se de estudio en fantoma. Es accionado por
biopsia de mama guiada por RM para superar motores piezoeléctricos, mientras que el me-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 18 / 88
canismo de inserción de la aguja es accionado contraste con los robots de cuerpo rígido, los ro-
por un motor neumático, tiene un total de 9 bots suaves tienen una deformación continua en su
GDL [2]. estructura flexible, lo que resulta en grados de li-
c. Biopsia e intervenciones neuronales bertad más complejos y a su vez con más similitud
Los procedimientos relacionados con el cere- a la anatomía humana. Los robots suaves adop-
bro incluyen biopsia, inyección de medicamen- tan materiales elásticos para el cuerpo principal y
tos, cirugía con láser, tratamiento con radia- materiales como polímeros, hules, siliconas u otros
ción y colocación de electrodos para la esti- materiales flexibles para sus partes móviles. Hasta
mulación cerebral profunda. La RM es la mo- el momento, únicamente se ha encontrado en la li-
dalidad de imágenes más utilizada que puede teratura un robot suave que se adapta a la tarea
visualizar tanto la función como la estructura de punción percutánea, así como uno adicional en
del cerebro [1]. desarrollo, ambos son mencionados a continuación
Comber [7], presentó un robot accionado neu- a. Robot suave de aguja percutánea guia-
máticamente para neurocirugía guiada por do por RM con actuador impulsado por
RM. La estructura de tubo concéntrico del ro- fluido
bot resultó en desafíos de control y fallas de
linealidad. Se adaptó posteriormente para el Se trata de un sistema robótico montado en
tratamiento de la epilepsia mediante ablación el paciente de tamaño pequeño para la coloca-
térmica y para la hipocampotomía transfora- ción de agujas percutáneas guiadas por RM,
menal. Tiene 5 GDL y una precisión promedio que permite la orientación e inserción simultá-
de 0.032mm. neas de la aguja en múltiples ubicaciones con
Ho [2], presentó un robot neuroquirúrgico varios robots. El dispositivo está diseñado pa-
compatible con RM. Usando dos alambres de ra ayudar al cirujano a realizar intervenciones
aleación con memoria de forma antagónica intraoperatorias, como la ablación por radio-
(SMA) como actuadores para cada articula- frecuencia y láser de los órganos abdominales
ción, usando la temperatura para controlar el [3].
movimiento de la articulación del robot. Este Para guiar la aguja del robot se consideraron 2
fue probado en fantoma y posee 4 GDL. grados de libertad planares en el punto de in-
serción predeterminado por el cirujano, estos
d. Otras aplicaciones grados de libertad se logran con tres cáma-
Stoianovici [8], desarrolló un robot de RM pa- ras fluídicas suaves, que están llenas de agua
ra biopsias óseas. Un estudio en fantoma mos- destilada. El sistema proporciona un posicio-
tró un error de focalización 2D promedio de namiento semiautomático de la aguja.
1,25 mm y un error 3D promedio de 1,39 mm. El sistema está construido con materiales que
Utiliza motores PneuStep, tiene 3 GDL, dos cumplen con el estándar de compatibilidad de
para posicionar la aguja y uno para accionar- RM. Para minimizar la interferencia con las
la. imágenes de RM, la estructura principal del
Franco [9], desarrolló un sistema robótico robot está impresa en 3D con polímeros bio-
montado en una mesa accionado neumática- compatibles. Los componentes restantes tam-
mente para ayudar a los médicos en la abla- bién están hechos de materiales no conducto-
ción de tumores hepáticos guiada por RM. Es- res, no metálicos y no ferromagnéticos.
te sistema robótico se sometió a dos estudios
clínicos con resultados prometedores. Los ex- b. Robot suave para biopsias en la región
perimentos de fantoma sugirieron que el aho- toracoabdominal compatible con RM
rro de tiempo potencial al usar este robot sería Actualmente, los autores de este artículo se
de 30 minutos en comparación a los procedi- encuentran trabajando en una innovación del
mientos de ablación hepática convencionales. dispositivo propuesto por Cruz [10], se trata
Tiene 4 GDL como cilindros neumáticos que de una plataforma experimental que contem-
son accionados por reguladores de presión pa- pla dos grados de libertad en una articula-
ra posicionar la aguja. ción semiesférica (para el posicionamiento de
la aguja), como la mostrada en la Figura 1,
III. Robots Suaves generando el movimiento con cuatro cámaras
Los robots suaves están frecuentemente inspirados como actuadores de activación neumática. Po-
en sistemas biológicos con la capacidad de adap- see un tercer grado de libertad para la inser-
tarse mejor a entornos de la misma naturaleza. En ción de la aguja.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 19 / 88
La innovación se centra en el uso de cámaras
de silicona que se accionan neumáticamente,
esto se asimila a tener una serie de globos co-
nectados de un costado entre sí que, al ser
insuflados, se producirá un movimiento angu-
lar. La silicona se encuentra inicialmente en
estado líquido en partes A y B, luego de ser
mezclada se vierte en moldes prediseñados e
impresos en 3D; pasando el tiempo de secado
quedan listos para ser montados en la base, ac-
cionando el movimiento al ser insuflados por
un compresor, como se muestra en la Figura
2.

Figura 2. a) Moldes impresos en 3D. b) Actuador en estado


pasivo. c) Actuador en estado activo.

Este dispositivo tiene la finalidad de automa-


tizar la etapa de extracción de tejido en las
biopsias con aguja, pretendiendo aumentar
con respecto a los procedimientos convencio-
nales, la precisión, sensibilidad, visibilidad y
control de la etapa de extracción de tejido en
biopsias, para su posterior análisis histopato-
Figura 1. Arquitectura robótica de los 3 GDL [1]. lógico y diagnóstico.

Estos dispositivos favorecen al diagnóstico oportuno de una de las


enfermedades más devastadoras del mundo: el cáncer.
Conclusión mundo: el cáncer, que se presenta en sus etapas inicia-
La cirugía robótica se ha convertido en una parte impor- les como tumores en los diversos órganos y tejidos del
tante de la cirugía clínica, puede ser aprovechada al ser cuerpo, para los cuales, los estudios de diagnóstico se
utilizada en conjunto con otras tecnologías como la RM, basan principalmente en biopsias. Siendo las biopsias de
que posee características y ventajas únicas dentro de la punción percutánea con aguja, las menos invasivas pa-
variedad de estudios de imágenes médicas. Con el de- ra el organismo, ya que conllevan un riesgo de infección
sarrollo de la tecnología, se ha desplegado una variedad postoperatoria más bajo, un tiempo de recuperación más
de nuevas aplicaciones de la robótica en la medicina que corto y una lesión mínima. Por lo que, además, la auto-
permiten al médico desarrollar sus actividades con ma- matización del procedimiento con dispositivos robóticos
yor soltura y seguridad, y al paciente acceder a estudios beneficia a todos los involucrados significativamente.
diagnósticos y tratamientos más eficientes que compro- Existe un reto en el desarrollo de materiales y tecno-
meten menos su estado de salud. logía para la robótica suave, que como se presenta en el
Las diversas aplicaciones que se mencionaron en el artículo, posee algunas bondades debido a su morfología
artículo favorecen principalmente al diagnóstico y decre- y constitución, sobre todo cuando se requiere interacción
mento de una de las enfermedades más devastadoras del directa con el humano, como en las cirugías y la medi-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 20 / 88
cina general. No obstante, los robots suaves tienen cada 5. Groenhuis, V., Siepel, F.J., Veltman, J., van Zandwijk, J.K., y
día más presencia en las diversas áreas de la ingeniería, Stramigioli, S. (2018). Stormram 4: An MR Safe Robotic System
for Breast Biopsy. Annals of Biomedical Engineering, 46(10),
lo que propiciará una gama más amplia de alternativas 1686-1696.
para seguir desarrollando tecnología y soluciones biomé- 6. Ball, M.W., Ross, E., Ghabili, K., Kim, C., Jun, C., Petrisor,
dicas. ✵ D., Pan, L., Epstein, I., Macura, J., Stoianovici, S., y Allaf,
E. (2017). Safety and Feasibility of Direct Magnetic Resonan-
ce Imaging-guided Transperineal Prostate Biopsy Using a No-
REFERENCIAS vel Magnetic Resonance Imaging-safe Robotic Device. Urology,
109, 216-221.
1. Tsekos, N., Khanicheh, A., Christoforou, E., y Mavroidis, C.
(2007). Magnetic Resonance–Compatible Robotic and Mecha- 7. Comber, D.B., Barth, E.J., y Webster, R.J. (2014). Design and
tronics Systems for Image-Guided Interventions and Rehabili- Control of an Magnetic Resonance Compatible Precision Pneu-
tation: A Review Study. Annual Review of Biomedical Engi- matic Active Cannula Robot. Journal of Medical Devices, 8(1),
neering, 9(1), 351-387. 011003.
2. Monfaredi, R., Cleary, K., y Sharma, K. (2018). MRI Robots 8. Stoianovici, D., Jun, C., Lim, S., Li, P., Petrisor, D., Fricke,
for Needle-Based Interventions: Systems and Technology. Bio- S., Sharma, K., y Cleary, K. (2018). Multi-Imager Compatible,
medical engineering society, 46(10), 1479-1497. MR Safe, Remote Center of Motion Needle-Guide Robot. IEEE
3. He, Z., Dong, Z., Fang, G., Ho, L., Cheung, L., Chang, C., Transactions on Biomedical Engineering, 65(1), 165-177.
Chong, N., Chan, K., Chan, M., y Kwok, W. (2020). De-
sign of a Percutaneous MRI-Guided Needle Robot With Soft 9. Franco, E., Ristic, M., Rea, M., y Gedroyc, W.M.W. (2016).
Fluid-Driven Actuator. IEEE Robotics and Automation Let- Robot-assistant for MRI-guided liver ablation: A pilot study.
ters, 5(2), 2100-2107. Medical Physics, 43(10), 5347.
4. Park, S., Kim, G., Lim, W., Yoon, H., Kim, J., Kang, S., y 10. Cruz, A.M. (2007). Diseño de un robot de tres grados de li-
Jo, H. (2017). A magnetic resonance image-guided breast need- bertad para punción, compatible con ambientes de tomografía
le intervention robot system: Overview and design considera- computada y resonancia magnética, y fabricación de un primer
tions. International Journal of Computer Assisted Radiology prototipo de laboratorio. Tesis de Maestría. Universidad Autó-
and Surgery, 12(8), 1319-1331. noma del Estado de México.

SOBRE LOS AUTORES


Isis Danae Sánchez Hernández es estudiante de Bioingeniería Médica en la Universidad Autónoma
del Estado de México. Se desempeña actualmente en el departamento de Ingeniería Biomédica en un
hospital de tercer nivel de atención y en el desarrollo de una plataforma robótica suave para biopsias
compatible con resonancia magnética. Sus áreas de interés incluyen Robótica Médica, Telemedicina y
desarrollo de Prótesis de miembro superior.

Adriana H. Vilchis González obtuvo el grado de doctor en Imagen, Visión y Robótica en el


Instituto Nacional Politécnico de Grenoble, Francia. Actualmente es profesor investigador en las
Facultades de Ingeniería y de Medicina de la Universidad Autónoma del Estado de México. Sus
intereses científicos incluyen Robótica Médica, Robots Suaves y Sistemas Mecatrónicos.

Juan C. Ávila Vilchis obtuvo el grado de doctor en el Instituto Nacional Politécnico de Grenoble,
Francia. Actualmente es profesor investigador en las Facultades de Ingeniería y de Medicina de la
Universidad Autónoma del Estado de México. Sus intereses científicos incluyen Modelado, Análisis y
Control de sistemas no lineales y Robótica Médica.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 21 / 88
ARTÍCULO ACEPTADO
De Big Data al Smart Data en datos no balanceados
con alta dimensionalidad y baja densidad: un
análisis experimental de técnicas de sobremuestreo
Armando Bolívar, Vicente García, Roberto Alejo y Rogelio Florencia-Juárez
Introducción El éxito en la extracción de conocimiento en Big Da-
El concepto de Big Data o datos masivos cuenta con di- ta, no sólo depende del algoritmo empleado para ello,
ferentes definiciones en la literatura. De manera general, sino del preprocesamiento que se realiza para aportar
se podría definir como grandes volúmenes de datos gene- veracidad y valor a los datos. Este proceso de transfor-
rados por dispositivos que hacen uso de la red de Inter- mación que convierte los datos crudos en datos de calidad
net. El beneficio real de Big Data no se encuentra en los se conoce como Smart Data. Por ello, uno de los aspec-
datos, sino en la habilidad de descubrir patrones con la tos que más impacta a los algoritmos de clasificación son
aplicación apropiada de las técnicas de análisis de datos. las problemáticas que pueden presentar los datos, tales
El análisis de datos masivos ha permitido tener avan- como: 1) clases no balanceadas y el solapamiento, 2) la
ces al desarrollar sistemas automáticos de predicción en separabilidad de las clases, y 3) la geometría, topología
diversas áreas como la medicina, negocios, transporte, y densidad [2].
energía, entre otras [1].
Para transformar los datos masivos en conocimiento, Conjuntos de datos masivos no balancea-
se utilizan técnicas de aprendizaje automático o Machine dos
Learning. Las técnicas se pueden dividir en dos principa- En tareas de clasificación de dos clases, cuando una de
les categorías: el aprendizaje supervisado y el aprendizaje las clases presenta un número menor de ejemplos con
no supervisado. En el aprendizaje supervisado los datos respecto a la otra, se dice que el conjunto de datos no
contienen una etiqueta de salida categórica o continua, a está balanceado. La razón de desigualdad puede ser lige-
partir de los cuales se entrenan modelos de clasificación ra, moderada o cuando hay una diferencia mayor de 1:10
o regresión. (un ejemplo de una clase hay diez de la otra), se dice que
Los algoritmos de clasificación se emplean en tareas es fuerte [3]. Esta diferencia ocasiona que los clasificado-
donde el objetivo es predecir una etiqueta de clase. Por lo res, entrenados con dicho conjunto de datos, presenten la
tanto, se usan en preguntas con respuestas dicotómicas tendencia a etiquetar la mayoría de los datos como de la
(dos clases) o multicotómicas (multiclase). Por ejemplo, clase predominante, ignorando a aquellos que pertenecen
dada una radiografía de toráx, ¿el paciente tiene COVID- a la clase menos representada. Esta problemática toma
19? o teniendo en cuenta los rangos de longitud de onda relevancia cuando la clase minoritaria, también llamada
de una imagen hiperespectral, ¿qué tipo de vegetación clase positiva, es la de mayor importancia en términos
representa cada pixel?. En regresión el objetivo es pre- económicos o humanos. Por ejemplo, en la detección de
decir un valor numérico continuo, por lo tanto, puede fraudes bancarios o de pacientes con cáncer.
dar respuesta a preguntas relacionadas con el precio de Las técnicas para mitigar los efectos de las clases no
una vivienda, la edad de una persona, el salario de un balanceadas en Big Data son similares a las utilizadas
empleado, el valor de una divisa, entre otros. en los problemas tradicionales: 1) soluciones a nivel de
En el aprendizaje no supervisado el conjunto de da- algoritmos, donde se ajusta el proceso de aprendizaje del
tos se caracteriza por no tener una etiqueta de clase, por algoritmo para subsanar la falta de ejemplos de la clase
lo tanto, no existe un conocimiento a priori. En este tipo minoritaria y 2) las soluciones a nivel datos, donde se eli-
de aprendizaje, por lo general, las tareas están dirigidas minan ejemplos de la clase mayoritaria (submuestreo) o
a encontrar grupos de datos cuyos elementos del mismo se generan ejemplos de la clase minoritaria (sobremues-
grupo son similares y al mismo tiempo que son distintos treo) [5]. En ambos casos, el proceso se realiza hasta lo-
entre grupos diferentes. grar que las clases estén aproximadamente balanceadas.

Este proceso de transformación que convierte los datos crudos en datos de


calidad se conoce como Smart Data.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 22 / 88

Los conjuntos con alta dimensionalidad pueden contener una gran


cantidad de atributos con valores iguales a cero.
SMOTE (Synthetic Minority Oversampling TEchni- problema de las clases no balanceadas como se espera-
que ) es una técnica de sobremuestreo ampliamente usa- ría. Por lo que, se producen bajas tasas de clasificación
da, que genera datos sintéticos de la clase minoritaria en términos de la media geométrica y del área bajo la
por interpolación [4]. Concretamente, dado un ejemplo curva ROC (Receiver Operating Characteristic ).
de la clase minoritaria se obtienen sus k vecinos más cer-
canos (kNN, k–Nearest Neighbor algorithm ). Posterior-
mente, se elige aleatoriamente uno de los k y se calcula
la diferencia entre dicho vecino y el ejemplo de clase mi-
noritaria. Al vector resultante, se le multiplican valores
aleatorios entre 0 y 1, los cuales serán añadidos a dicho
vector (véase la Figura 1). Por lo general, en la litera-
tura se usa k=5, cambiar este valor puede implicar usar
mayor o menor información, por lo que, significaría un
mejor o peor desempeño.
Para determinar si un ejemplo es un vecino más cer-
cano, se emplea la distancia euclidiana como medida de
similitud. Sin embargo, es ampliamente conocido que di- Figura 2. Conjunto de datos con baja y alta densidad.
cha distancia presenta ciertas desventajas cuando el con-
junto de datos tiene un gran número de atributos [7–9]. La alta dimensionalidad es una de las problemáticas
Esto ocasiona la llamada maldición de la dimensionali- inherentes al Big Data [9]. No obstante, hasta el mo-
dad, que hace referencia al fenómeno de concentración mento, la mayoría de las técnicas de sobremuestreo, no
de distancias, por lo que, esto podría implicar que la dis- se han enfocado a conjuntos de datos masivos con alta
tancia al vecino más cercano sea igual a la distancia al dimensionalidad y además baja densidad. Algunos traba-
vecino más lejano. jos como [5], [8] y [9] han considerado la dimensionalidad
de los datos, llegando a estudiar hasta un máximo de 893
atributos.
A pesar de que se ha aceptado que la dimensionalidad
es la principal circunstancia que afecta a los algoritmos
basados en el vecino más cercano, no se ha estudiado en
Big Data si dicho comportamiento se presenta también si
el conjunto muestra una baja densidad. Por ello, el obje-
tivo de este trabajo es analizar el comportamiento de dos
algoritmos de sobremuestreo: SMOTE y sobremuestreo
aleatorio (ROS, Random Over-Sampling ), y examinar si
pierden capacidad de resolver el problema de las clases
no balanceadas en situaciones donde los datos contienen
Figura 1. SMOTE con 5 vecinos más cercanos. un gran número de atributos con valores iguales a cero.
Esto nos llevaría a plantear estrategias que consideren
Otra característica de los conjuntos con alta dimen- no sólo el número de atributos sino también la cantidad
sionalidad es que pueden contener una gran cantidad de de datos vacíos.
atributos con valores en cero, lo que se conoce como datos
escasos (data sparse ) o de baja densidad. En la Figura 2, Desarrollo experimental
se muestra un ejemplo de un conjunto de datos con baja Para analizar el problema de la dimensionalidad en es-
y otro con alta densidad. En el lado izquierdo, se puede cenarios de datos con clases no balanceadas y de baja
observar que la baja densidad ocasiona que la imagen sea densidad, se emplearon métodos y arquitecturas amplia-
poco intensa, mientras que en el lado derecho la imagen mente aceptadas en la comunidad científica. Como pla-
muestra un color más sólido. taforma de procesamiento para datos masivos, se empleó
Basgall et al. [8], demostraron que SMOTE en con- Apache Spark 3.1.1, el cual, integra diversos módulos
juntos de datos con 1,000 dimensiones, no resuelve el para SQL y aprendizaje automático. Se utilizó Apache

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 23 / 88
Spark en Azure, el cual es un servicio que administra de nes correctas o incorrectas. En la matriz, el título de
forma completa y total servidores virtuales en la nube. las columnas representa la salida estimada por parte del
El servidor empleado en los experimentos contó con clasificador y las filas indican las salidas reales. Por ello,
2 CPU virtuales y 16 GB de memoria, el cual fue confi- los elementos en la diagonal principal corresponden al
gurado como nodo maestro/ejecutor. Como ejecutores se número de aciertos correctos, en la clase positiva y nega-
emplearon dos máquinas, cada una con 2 CPU virtuales tiva, mientras que el resto de las entradas son los errores
y 8 GB de memoria. Se utilizó Debian 10.8, Java 11 y el cometidos.
lenguaje de programación Scala.
SMOTE fue implementado con la técnica del ve-
cino más cercano para ambientes Big Data, denominada
kNN-IS (k–Nearest Neighbor algorithm with an Iterative
Spark-based design ) [10], que utiliza las operaciones de
Map y Reduce de Spark para hacer el cálculo exacto del Figura 3. Matriz de confusión para un problema de dos
vecino más cercano. Mediante el manejo de memoria y clases.
caché de Spark se reusaron las particiones con los datos
de entrenamiento, mientras que los datos de prueba se
mantuvieron almacenados en memoria. De esta manera, Para estimar el desempeño de un clasificador en pro-
se puede utilizar el kNN en bases de datos con millones blemas no balanceados, se suelen emplear la tasa de
de instancias. SMOTE-BD es una variante de SMOTE verdaderos positivos (T P R = T P/(T P + F N )) que
que hace uso de kNN-IS para el cálculo del vecino más representa la proporción de los ejemplos positivos co-
cercano [8]. ROS y SMOTE-BD fueron ejecutados hasta rrectamente clasificados, y la tasa de verdaderos nega-
alcanzar un número similar de ejemplos en ambas clases. tivos (T N R = T N/(T N + F P )) que corresponde a la
Para el cálculo del vecino más cercano se usó el valor de proporción de los ejemplos negativos correctamente cla-
k=5 sificados. Asimismo, se usa el área bajo la curva ROC
En nuestro estudio de clases no balanceadas, su rela- (AUC, Area Under the Curve ), la cual se calcula como:
ción con la alta dimensionalidad y la baja densidad de AU C = (T P R + T N R)/2 [8].
los datos, hicimos uso de la base de datos KDD 2010
(bridge to algebra 2006-2007 ), la cual fue descargada del Resultados y discusiones
repositorio de LIBSVM (https://www.csie.ntu.edu. A continuación, se analizan y discuten los principales re-
tw/~cjlin/libsvmtools/datasets/). La base de datos sultados obtenidos del estudio del comportamiento de la
contiene los registros de las interacciones entre estudian- técnica SMOTE-BD, utilizando la distancia euclidiana y
tes y un sistema tutorial para aprender álgebra, en don- con k = 5 tomando como referencia los experimentos de
de, cada vez que el estudiante usó el software educativo Basgall et al. [8], en un problema de alta dimensionali-
se generó una transacción. dad de dos clases no balanceadas y con baja densidad.
KDD 2010 cuenta con dos clases, las cuales represen- Adicionalmente, se incluye en el estudio la técnica ROS
tan si un estudiante resolvió un problema en el primer debido a su simplicidad y que ha generado resultados
intento (clase 1) o falló (clase 0). Asimismo, dicho con- competitivos en diversos problemas no balanceados.
junto tiene un total de 1, 163, 024 atributos y 19, 264, 097 La Figura 4, muestra los resultados en términos de
ejemplos. Como el objetivo de este artículo son las cla- T P R, para ROS, SMOTE-BD y el conjunto de datos
ses no balanceadas, el conjunto de datos fue modificado original. En este último, T P R ≈ 0, por ello, no se logra
para crear problemas de dos clases con una razón de visualizar en la figura. Analizando los resultados de ROS,
desbalance de 1 a 10, es decir, por cada ejemplo de la se observa que, independientemente del número de atri-
clase minoritaria hay diez de la mayoritaria. Asimismo, butos, siempre T P R ≥ 0,8, mientras que para SMOTE-
por limitaciones de la infraestructura, se optó por usar BD, a partir de los 400 atributos T P R está por arriba
subconjuntos de 30, 000 ejemplos. de 0,8. Si bien, se mejora la tasa de clasificación sobre
Para analizar el efecto de la alta dimensionalidad, se la clase minoritaria, estos resultados en SMOTE-BD son
crearon conjuntos de datos con diferentes cantidades de contradictorios, ya que de acuerdo a la literatura, se espe-
atributos que van de 50, 100, 200, 300, ... hasta 900. Se hi- raría que a mayor dimensionalidad menor su efectividad
zo uso de un clasificador mediante un árbol de decisión para combatir el desbalance [5]. No obstante, la base de
(incluido en las librerías de Apache Spark). Los diversos datos aquí empleada, se caracteriza por tener diversos
conjuntos de datos se dividieron en dos partes: entrena- atributos con valores en cero. En este sentido, existen
miento (70 % de los datos) y prueba (30 % de los datos). registros, en donde, del total de atributos, solo uno de
Para la evaluación del clasificador, se utilizó una ma- ellos tiene un valor distinto de cero. Por ello, SMOTE-
triz de confusión de 2 × 2 (véase la Figura 3), en la cual, BD no se vería afectado por la alta dimensionalidad, sino
las entradas (i, j) contienen el número de las prediccio- en realidad, por la insuficiente información para generar

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 24 / 88
datos sintéticos. Esta sería la razón principal por la cual, a partir de los 400 atributos logra incrementar AU C .
conforme se incrementa la dimensionalidad T P R mejora. Esto último se puede explicar, de que a mayor dimen-
sionalidad más atributos presentan valores diferentes de
cero.
Estos resultados nos deja ver que hay otros aspectos a
considerar en la aplicación de SMOTE-BD en conjuntos
de datos no balanceados. La densidad de los datos parece
tener un impacto importante en el clasificador. El com-
portamiento de SMOTE-BD en conjuntos de datos poco
densos ha sido poco estudiado y puede ser una línea de
investigación a seguir en Big Data donde los conjuntos
de datos pueden presentar poca densidad.

Figura 4. Resultados en términos de TPR.


Por otro lado, a pesar de que se logra un incremen-
to de T P R, la efectividad del clasificador sobre la clase
mayoritaria se ve afectada por ambos métodos de sobre-
muestreo. En la Figura 5 se muestran valores de T N R,
en donde, a partir de los 400 atributos con SMOTE-
BD, se produce una reducción drástica pasando de un
T N R ≈ 1 (conjunto original) a un T N R < 0,4. Este es
un comportamiento común en problemas con clases no Figura 6. Resultados en términos de AUC.
balanceadas. Por lo que respecta a ROS, también pre-
senta una reducción. Sin embargo, se mantiene estable Conclusiones
independientemente del número atributos. En el presente estudio se exploró el comportamiento de
SMOTE-BD en datos masivos con clases no balanceadas
que presentan una alta dimensionalidad y baja densidad.
Si bien, se ha documentado que debido a que SMOTE
emplea la distancia euclidiana, la llamada maldición de
la dimensionalidad afecta al desempeño de este algorit-
mo. No obstante, cabe mencionar que no se ha estudiado
si el efecto es el mismo cuando se presenta una baja den-
sidad. Por esta razón, en este trabajo, se realizaron una
serie de experimentos en un entorno Big Data con clases
no balanceadas que presentan una alta dimensionalidad
y baja densidad.
Los resultados obtenidos mostraron que conforme se
incrementa la dimensionalidad de los datos la efectividad
de SMOTE-BD mejora, reflejándose en un incremento
en los valores de T P R y AU C . Se esperaba que, al in-
crementarse el número de dimensiones el rendimiento de
Figura 5. Resultados en términos de TNR. SMOTE-BD decreciera. Los resultados sugieren que exis-
ten otros factores a considerar además de la dimensiona-
En la Figura 6 se presentan los resultados de AU C . Se lidad como la densidad de los datos. Por otro lado, los
puede observar que ambas técnicas incrementan la tasa resultados muestran que ROS es muy estable indepen-
de clasificación con respecto al conjunto original. ROS dientemente del número de atributos.
como ya se había observado se mantiene estable a pe- Trabajos futuros estarán enfocados a realizar un es-
sar de los cambios en la dimensionalidad. SMOTE-BD, tudio comparativo con bases de datos con alta densidad

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 25 / 88
y de mayor número de datos, así como el uso de técnicas 5. Elreedy, D., y Atiya, F. (2019). A comprehensive analysis of
de transformación del espacio.✵ synthetic minority oversampling technique (SMOTE) for hand-
ling class imbalance. Information Sciences, 505, 32-64.
6. Blagus, R. y Lusa, L. (2013). SMOTE for high–dimensional
REFERENCIAS class–imbalanced data. BMC Bioinformatics, 14(106), 1-16.
1. Triguero, I., García-Gil, D., et al. (2018). Transforming big data 7. Govindarajan, M. (2021). Challenges in Big Data Analysis. En
into smart data: An insight on the use of the knearest neigh- Khosrow-Pour M. (Ed.) Encyclopedia of Information Science
bors algorithm to obtain quality data. Wiley Interdisciplinary and Technology, IGI-Global, 577-585.
Reviews: Data Mining and Knowledge Discovery, 9(2), 1-24.
8. Basgall, M.J., Hasperué, W., et al. (2019). An analysis of local
2. Lorena, A.C., Maciel, A.I., et al. (2017). Data complexity meta- and global solutions to address big data imbalanced classifica-
features for regression problems. Machine Learning, 107(1), tion: A case study with SMOTE preprocessing. En 7th Confe-
209-246. rence on Cloud Computing & Big Data, La Plata, Argentina,
75-85.
3. Leevy, J.L., Khoshgoftaar, T.M., et al. (2018). A survey on ad-
dressing high-class imbalance in big data. Journal of Big Data, 9. Juez-Gil, M., Arnaiz-González, A., et al. (2021). Experimen-
5(42), 1-30. tal evaluation of ensemble classifiers for imbalance in big data.
Applied Soft Computing, 108, 1-14.
4. Fernández, A., García, S., et al. (2018). SMOTE for learning
from imbalanced data: Progress and challenges, marking the 15- 10. Maillo J., Ramírez S., et al. (2017). kNN-IS: An iterative spark-
year anniversary. Journal of Artificial Intelligence Research, based design of the k-nearest neighbors classifier for big data.
61, 863-905. Knowledge-Based Systems, 117, 3-15.

SOBRE LOS AUTORES

Armando Bolívar es un estudiante del Doctorado en Ciencias de la Ingeniería Avanzada en la Univer-


sidad Autónoma de Ciudad Juárez. Sus intereses de investigación incluyen preprocesamiento de datos
en ambientes Big Data.

Vicente García es Doctor en Sistemas Informáticos Avanzado por la Universitat Jaume I, es profesor
en la Universidad Autónoma de Ciudad Juárez. Su interés es aprendizaje automático en temas de
clasificación, evaluación, test estadísticos y preprocesamiento de conjuntos de datos.

Roberto Alejo es Doctor en Sistemas Informáticos Avanzados por la Universitat Jaume I, España
(2011). Adscrito a la División de Estudios de Posgrado e Investigación del Tecnológico Nacional de Mé-
xico, campus Toluca. Es especialista en redes neuronales artificiales, aprendizaje automático y minería
de datos.

Rogelio Florencia-Juárez es Doctor en Ciencias de la Computación por el Instituto Tecnológico de


Tijuana, México (2016). Es profesor de tiempo completo en la Universidad Autónoma de Ciudad Juárez,
México. Sus intereses se encuentran en las áreas de procesamiento del lenguaje natural, interfaces de
lenguaje natural para bases de datos y representación del conocimiento.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 26 / 88
ARTÍCULO ACEPTADO
Reglas de asociación para el estudio de la vaginosis
bacteriana
Freddy de la Cruz Ruiz y Juana Canul-Reich
Introducción nosis bacteriana por la gran cantidad de bacterias que
En la actualidad los algoritmos de aprendizaje automá- coexisten en esta mucosa. Para facilitar su comprensión
tico están teniendo auge en áreas diversas al estudiar da- es necesario describir estas interacciones bacterianas que
tos financieros, astronómicos, geofísicos, sobre proteínas, desarrollan la enfermedad. Una regla de asociación es
ácidos nucleicos, entre otros. Los algoritmos del apren- una implicación de la forma si X ⇒ Y donde a X se le
dizaje automático buscan patrones en estos datos y por conoce como el antecedente, y a Y se le conoce como
una parte predicen patrones (aprendizaje supervisado) y el consecuente [7]. El algoritmo que crea las reglas de
por otra describen patrones (aprendizaje no supervisado) asociación ubica a las bacterias Gram - en el antecedente
[1]. de la regla y en el consecuente al dignóstico positivo de
El aprendizaje supervisado entrena a un algoritmo vaginosis.
proporcionando preguntas (características) y respuestas
(etiquetas). En el aprendizaje no supervisado se propor-
cionan las características al algoritmo, no las etiquetas.
¿Cómo las reglas de asociación describen
Las reglas de asociación son una de las técnicas del apren- la coexistencia bacteriana detonante de la
dizaje automático no supervisado y buscan establecer re- vaginosis bacteriana?
laciones entre las variables [2]. Identificar las especies de bacterias que coexisten para
Los estudios biomédicos sobre enfermedades, por desarrollar la vaginosis bacteriana no siempre es fácil.
ejemplo, diabetes, cáncer, hipercolesterolemia familiar, Hay una gran variedad de algoritmos de aprendizaje au-
síndrome metabólico, Síndrome de Guillain Barré, tam- tomático con diversos enfoques, las reglas de asociación
bién han creado bases de datos con cientos de registros. se adaptan eficientemente al problema de la vaginosis
Una de las enfermedades que es factible estudiar con al- bacteriana.
goritmos de aprendizaje automático es la vaginosis bacte- En el modelo que las reglas de asociación reportan
riana (VB+) [3, 4, 5]. Esta enfermedad es una alteración como resultado de minar el conjunto de datos, -minar es
de la flora normal bacteriana presente en la mucosa va- el proceso de extracción de conocimiento a partir de con-
ginal de la paciente. Hay dos especies de Lactobacillus juntos de datos -, la regla ubica en su antecedente a las
en esta mucosa. Lactobacillus crispatus está asociada bacterias Gram - que coexisten para desplazar a las es-
con la protección de esta mucosa y Lactobacillus iners pecies de Lactobacillus que protegen a la mucosa vaginal
esta asociada con flora vaginal alterada. de la paciente. En el consecuente de la regla el algoritmo
Las bacterias Gram - (se lee Gram negativa) en el es- ubica el estado patológico que es la vaginosis bacteriana,
tado de salud están en una densidad de crecimiento muy (ver Figura 1). Dado que una regla de asociación es una
bajo debido a que Lactobacillus crispatus evita su implicación que lee: si ocurre esta condición sucede es-
crecimiento y no pueden desarrollar vaginosis bacteriana. te hecho, computacionalmente en la primera parte de la
Cuando falla la protección de Lactobacillus crispatus implicación - llamada antecendete - se van a ubicar a las
crece el Lactobacillus iners que marca la condición bacterias Gram – las cuales son un grupo de bacterias
alterada de la flora normal. También crecen las bacte- que viven en la mucosa vaginal de la paciente en estado
rias Gram - desencadenando vaginosis bacteriana. Esta limitado. En la segunda parte de la implicación - llama-
infección se caracteriza por presentar descarga lechosa da consecuente- se va a ubicar el estado infeccioso que
vaginal, olor (a pescado) e irritación vaginal [6]. es consecuencia de que las bacterias Gram – crezcan por
Es complicado comprender la etiología de la vagi- encima de su límite normal.

El crecimiento excesivo de las bacterias Gram - en la mucosa vaginal


detona VB+.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 27 / 88

Figura 1. Regla de asociación que ubica a las bacterias Gram - en el antecedente de la regla y el estado
patológico en el consecuente.

Tabla 1. Variables seleccionadas para la creación de reglas de asociación.


Variable Descripción
EDAD30 Edad dividida en <= 30 y > 30
Megasphaera Magasphaera tipo 1. Clasificado como positivo o ne-
gativo durante el diagnóstico.
Atopobium Atopobium vaginae. Clasificado como positivo o ne-
gativo durante el diagnóstico.
Gardnerella Gardnerella vaginalis. Clasificado como positivo o
negativo durante el diagnóstico.
VBPCR Diagnóstico de vaginosis por PCR (Reacción en ca-
dena de la polimerasa). Clasificado como vaginosis
positiva, negativa e indeterminada.
MH Mycoplasma hominis. Clasificado como positivo o
negativo durante el diagnóstico.
MG Mycoplasma genitalium. Clasificado como positivo
o negativo durante el diagnóstico.
UP Ureaplasma parvum. Clasificado como positivo o
negativo durante el diagnóstico.
UU Ureaplasma urealyticum. Clasificado como positivo
o negativo durante el diagnóstico.
CrsipatusCqRange, Valor Cq (Ciclo de cuantificación en el termoci-
GasseriCqRange, clador) para el que la densidad de crecimiento es
JenseniiCqRange e detectada. Estas cuatro variables pueden tomar los
InersCqRange valores indetectable, densidad de crecimiento baja
y alta.

El algoritmo Apriori se utilizó para extraer las re- con significancia biológica y estadística se esquematiza a
glas. Este algoritmo crea las reglas de asociación a partir continuación, (ver Figura 2).
del conjunto de datos que contiene los datos clínicos de
cada paciente con vaginosis, proporcionado por [8].
Proceso de preparación de los datos.
El conjunto de datos fue sometido a preprocesamiento
para corregir posibles valores faltantes y/o valores atí-
picos. También se cambió el formato de las variables de
númerico a categórico ya que este es el tipo de variable
que procesa el algoritmo Apriori para crear las reglas.
Como ejemplo revisemos la variable VBPCR que es la
que registra los casos positivos y negativos de vaginosis.
El valor 1 registra los casos positivos de vaginosis el cuál
fue renombrado a VaginosisPos, el valor 2 representa los
casos negativos el cuál fue renombrado a VaginosisNeg.
Las variables se renombran de forma que representen su
valor de forma explicita. La Tabla 1 muestra las variables
consideradas para crear las reglas de asociación. Figura 2. Proceso experimental durante la creación de reglas
El proceso experimental para la creción de reglas, se- de asociación. En el antecedente las bacterias hacen sinérgia
lección de reglas estadísticamente significativas, selección para desarrollar la patología del consecuente.
de reglas desde el enfoque biológico y obtención de reglas

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 28 / 88
El proceso experimental empezó con el conjunto de en 7 %. Este permitió al algoritmo crear los conjuntos de
datos crudos. Durante la limpieza de datos, selección y elementos frecuentes (que tienen una frecuencia mayor
transformación se eliminaron variables que no estaban o igual al umbral establecido). Al igual que para el so-
relacionadas con vaginosis bacteriana. También se re- porte, se estableció la confianza en 90 %. Esta permitió
nombraron las variables para que estas representen su al algoritmo crear las reglas de asociación (aquellas en
valor de forma explícita y se categorizó el valor de cada las que la probabilidad de ocurrencia es mayor o igual al
variable. Una vez preprocesado el conjunto de datos, umbral establecido).
se extrajeron las reglas de asociación con el algoritmo Es indispensable determinar el soporte y la confianza
Apriori. experimentalmente para que sirvan de directriz al algo-
Para filtrar reglas significativas se usó la prueba exac- ritmo Apriori. El parámetro appearence del algoritmo
ta de Fisher como métrica de calidad y las funciones Apriori restringe al consecuente al item VaginosisPos
proporcionadas en el paquete ARules. Un experto en puesto que nuestro interés está en el diagnóstico de va-
biología realizó la validación biológica de las reglas que ginosis bacteriana positiva (VB+). El algoritmo con los
presentaron significancia estadística. El resultado de la parámetros mencionados creó 58 reglas.
validación estadística y biológica es el modelo en forma Se seleccionaron reglas no redundantes (función
de reglas que describen a las bacterias que interactúan is.redundant), estadísticamente significativas (función
para desarrollar vaginosis bacteriana, (ver Figura 2). is.significant) y maximales (función is.maximal) [7]. La
función is.redundant() se apoya de la prueba exacta de
Proceso de extracción de reglas de asocia- Fisher [9] para seleccionar reglas no redundantes. Esta
ción función devuelve un conjunto con valores falso para re-
glas no redundantes y verdadero para reglas redundantes.
Para que el algoritmo Apriori cree las reglas se investigó La función is.significant() usa el método de Fisher, un
el porcentaje para la métrica soporte. Esta métrica va a valor alfa de 0.01 y un ajuste (Bonferroni) para corregir
medir la frecuencia de aparición de un conjunto de ele- el error que surge de las multiples comparaciones de la
mentos en el conjunto de datos. También se investigó el hipótesis nula. Esta función determina cuál regla es es-
porcentaje para la métrica confianza. Esta métrica esta- tadísticamente significativa y cuál no.
blece la probabilidad con la que el antecedente predice la La función is.maximal() solo nos reporta reglas que son
presencia del consecuente. Se exploraron los valores de 5 maximales. Una regla maximal es creada con un conjun-
a 15 % para el soporte y de 80 a 95 % para la confian- to de items frecuentes maximal y este conjunto es aquel
za. La forma de determinar los mejores porcentajes fue que no está incluido en ningún otro conjunto de items
a través del resultado reportado por la métrica de cali- frecuentes. Después de filtrar el conjunto de 58 reglas
dad calculada para cada regla. Se estableció el soporte solo 17 reglas fueron significativas, Tabla 2.

Tabla 2. Reglas de asociación con significancia estadística y frecuencia de cada regla en el conjunto de datos bajo
estudio.♣
LHS RHS Frec
[1]{AtopobiumPos,MegasphaeraPos,MycoplasGeniNeg,UreaplasUreaNeg } ⇒ {VaginosisPos} 25
[2]{AtopobiumPos,inersHighGrowthDensity,MegasphaeraPos,UreaplasUreaNeg } ⇒ {VaginosisPos} 16
[3]{AtopobiumPos,GardnerellaPos,MegasphaeraNeg,MycoplasHomiNeg } ⇒ {VaginosisPos} 16
[4]{AtopobiumPos,GardnerellaPos,MegasphaeraNeg,UreaplasUreaNeg } ⇒ {VaginosisPos} 18
[5]{AtopobiumPos,gasseriUndetectable,MycoplasGeniNeg,UreaplasUreaNeg } ⇒ {VaginosisPos} 22
[6]{AtopobiumPos,GardnerellaNeg,MegasphaeraPos } ⇒ {VaginosisPos} 17
[7]{AtopobiumPos,GardnerellaPos,inersHighGrowthDensity } ⇒ {VaginosisPos} 17
[8]{AtopobiumPos,GardnerellaPos,MycoplasGeniNeg,UreaplasParPos } ⇒ {VaginosisPos} 17
[9]{AtopobiumPos,GardnerellaPos,MycoplasGeniNeg,MycoplasHomiNeg,UreaplasUreaNeg } ⇒ {VaginosisPos} 17
[10]{AtopobiumPos,MegasphaeraPos,UreaplasParPos } ⇒ {VaginosisPos} 15
[11]{AtopobiumPos,gasseriUndetectable,MegasphaeraPos } ⇒ {VaginosisPos} 15
[12]{AtopobiumPos,GardnerellaPos,gasseriUndetectable } ⇒ {VaginosisPos} 15
[13]{AtopobiumPos,GardnerellaPos,UreaplasParPos,UreaplasUreaNeg } ⇒ {VaginosisPos} 15
[14]{AtopobiumPos,crisLowGrowthDensity,GardnerellaPos,UreaplasUreaNeg } ⇒ {VaginosisPos} 15
[15]{AtopobiumPos,MycoplasHomiPos,UreaplasUreaNeg } ⇒ {VaginosisPos} 18
[16]{AtopobiumPos,inersHighGrowthDensity,UreaplasParPos } ⇒ {VaginosisPos} 16
[17]{AtopobiumPos,inersHighGrowthDensity,MycoplasHomiNeg } ⇒ {VaginosisPos} 16
♣ Un mayor número de bacterias en el LHS (mayor o igual 3) incrementa la precisión del diagnostico.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 29 / 88
Validación biológica de las reglas extraí- jo estudio [8], para determinar si los patrones descritos
das en las reglas representan el comportamiento observado
en la clínica. La validación reportó 5 reglas, Tabla 3. El
El conjunto con las 17 reglas que es estadísticamente sig- conjunto de reglas resultante representa los patrones bac-
nificativo fue sometido a la inspección por un experto en terianos en el conjunto de datos que detonan la vaginosis
biología responsable de la recolección de los datos ba- bacteriana.

Tabla 3. Patrones bacterianos que desencadenan vaginosis bacteriana y frecuencia de cada regla
en el conjunto de datos bajo estudio.♣
LHS RHS Frec
[1]{AtopobiumPos, GardnerellaPos, inersHighGrowthDensity} ⇒ {VaginosisPos} ƒ 17
[2]{AtopobiumPos, MegasphaeraPos, UreaplasmaParPos} ⇒ {VaginosisPos} ƒ 15
[3]{AtopobiumPos, gasseriUndetectable, MegasphaeraPos} ⇒ {VaginosisPos} ƒ 15
[4]{AtopobiumPos, GardnerellaPos, gasseriUndetectable} ⇒ {VaginosisPos} ƒ 15
[5]{AtopobiumPos, inersHighGrowthDensity, UreaplasmaParPos} ⇒ {VaginosisPos} ƒ 16
♣ Un mayor número de bacterias en el LHS (mayor o igual 3) incrementa la precisión del diagnóstico.

Interpretación biológica de las reglas sente para detonar vaginosis bacteriana.


La regla 1 menciona que las bacterias Atopobium vagi- La regla número 4 menciona a Atopobium vaginae
nae , Gardnerella vaginalis y el Lactobacillus iners y Gardnerella vaginalis por una parte y por otra men-
desarrollan vaginosis bacteriana, Tabla 3. La regla 1 coin- ciona la ausencia de Lactobacillus gasseri para el de-
cide con lo que se observa en la clínica puesto que se ha sarrollo de la vaginosis bacteriana. La regla 5 menciona
reportado [8, 10] que Lactobacillus iners esta asociado que Atopobium vaginae , el Lactobacillus iners y la
a flora normal alterada por consecuencia la presencia de bacteria Ureaplasma parvum para desarrollar vagino-
Atopobium vaginae , Gardnerella vaginalis y Lac- sis bacteriana.
tobacillus iners detonan vaginosis bacteriana. Las reglas 1, 2 y 5 de la Tabla 3 son específicas para
La regla 2 dice que debe coexistir Atopobium va- el diagnóstico puesto que reporta bacterias [8, 10] obser-
ginae , Magasphaera filotipo 1 y Ureaplasma par- vadas en la clínica. Las reglas 3 y 4 son menos específicas
vum para detonar vaginosis bacteriana en la paciente. La para el diagnóstico ya que Lactobacillus gasseri tie-
regla número 3 menciona la coexistencia de Atopobium ne una participación parcial en el desarrollo de vaginosis
vaginae y Megasphaera filotipo 1 por una parte y bacteriana comparado a las bacterias reportadas por las
por otra dice que Lactobacillus gasseri debe estar au- reglas 1, 2 y 5.

Una regla de asociación inserta en su antecedente las bacterias


coexistentes detonantes de VB+.
¿De qué manera la obtención de los mo- asociación orienta de forma exacta al médico a tomar las
delos que describen los patrones involu- decisiones que tienen como consecuencia un tratamineto
crados en el desarrollo de la vaginosis bac- apropiado para mejorar la salud de la paciente.
teriana mejora la salud de la paciente? Conclusiones
El modelo en forma de reglas de asociación que repor-
ta el algoritmo Apriori tiene alto impacto en la vagi- La vaginosis bacteriana no es fácil de diagnosticar ade-
nosis bacteriana por que describe su etiología de origen cuadamente por su etiología de origen polimicrobiana.
polimicrobiano. Esta característica polimicrobiana puede Los algoritmos de reglas de asociación son una técnica
complicar el diagnóstico adecuado. Un mal diagnóstico que modelan de forma eficiente las bacterias que coexis-
incapacita al médico o no lo orienta de forma adecuada ten para detonar la vaginosis bacteriana.
en la toma de decisiones. El modelo en forma de reglas de asociación propor-
La comprensión exacta del detonante de esta in- ciona datos precisos al médico y apoya el diagnóstico, lo
fección descrita por el modelo en forma de reglas de que orienta la toma de decisiones.✵

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 30 / 88
6. Bagnall, P., Rizzolo, D. (2017). Bacterial vaginosis: a practi-
REFERENCIAS cal review. Journal of the American Academy of PAs, 30(12),
15-21.
1. Hernández-Torruco, J., Canul-Reich, J., Frausto-Solís, J.
(2014). El aprendizaje computacional en el diagnóstico de en- 7. Hornik, K., Grün, B., Hahsler, M. (2005). arules-A computatio-
fermedades. Komputer Sapiens, 2014(3), 20-24. nal environment for mining association rules and frequent item
sets. Journal of statistical software, 14(15), 1-25.
2. Sandoval, L.J. (2018). Algoritmos de aprendizaje automático 8. Sanchez-Garcia, E.K., Contreras-Paredes, A., Martinez-
para análisis y predicción de datos. Revista Tecnológica, 11. Abundis, E., Garcia-Chan, D., Lizano, M., y de la cruz-
3. Baker, Y.S., Agrawal, R., Foster, J.A., Beck, D., y Dozier, G. Hernandez, E. (2019). Molecular epidemiology of bacterial
(2014A). Detecting bacterial vaginosis using machine learning. vaginosis and its association with genital micro-organisms in
En Proceedings of the 2014 ACM Southeast Regional Confe- asymptomatic women. Journal of medical microbiology, 68(9),
rence, 1-4. 1373-1382.
9. Hahsler, M. (2015). A probabilistic comparison of commonly
4. Baker, Y.S., Agrawal, R., Foster, J. A., Beck, D., y Dozier, used interest measures for association rules. United States.
G. (2014B). Applying machine learning techniques in detecting Southern Methodist University. Recuperado el 8 de enero de
Bacterial Vaginosis. En 2014 International Conference on Ma- 2022, https://mhahsler.github.io/arules/docs/measures.
chine Learning and Cybernetics, 1, 241-246).
10. Kusters, J. G., Reuland, E. A., Bouter, S., Koenig, P., y Dorigo-
5. Beck, D., y Foster, J.A. (2015). Machine learning classifiers pro- Zetsma, J. W. (2015). A multiplex real-time PCR assay for rou-
vide insight into the relationship between microbial communi- tine diagnosis of bacterial vaginosis. European Journal of Cli-
ties and bacterial vaginosis. BioData mining, 8(1), 1-9. nical Microbiology and Infectious Diseases, 34(9), 1779-1785.

SOBRE LOS AUTORES

Freddy de la Cruz Ruiz es estudiante del Doctorado en Ciencias de la Computación en la División


Académica de Ciencias de la Tecnología y la Información, Universidad Juárez Autónoma de Tabasco.
El obtuvo su grado de Maestro en Ciencias Básicas Biomédicas en la División Académica de Ciencias
de la Salud, Universidad Juárez Autónoma de Tabasco. Sus intereses de investigación son en el área de
biología molécular y bioinformática.
Juana Canul-Reich Es Doctora en Ciencias de la Computación e Ingeniería por la Universidad
del Sur de Florida. Es Profesora-Investigadora en la División Académica de Ciencias y Tecnologías
de la Información de la UJAT. Es miembro fundador del Cuerpo Académico Inteligencia Artificial,
consolidado ante el Prodep. Desde el 2015, es miembro del Sistema Nacional de Investigadores, del
Sistema Estatal de Investigadores del Estado de Tabasco y cuenta con el perfil Prodep. Es árbitro en
revistas científicas nacionales e internacionales. Sus intereses en investigación se enfocan en la Ciencia
de Datos e Inteligencia Artificial en el área de la Salud.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 31 / 88
ARTÍCULO ACEPTADO
Aprendizaje Automático para la determinación de
factores que afectan la calidad del sueño
Mabel Vázquez Briseño, Arturo Laflor Hernández, Juan Iván Nieto Hipólito, Christian Navarro Cota
y Juan de Dios Sánchez López
Introducción define como: “ Comportamientos de estilo de vida y las
El aprendizaje automático es una rama de la inteligen- condiciones ambientales que facilitan el sueño y mejoran
cia emula la inteligencia humana usando técnicas que le la calidad del sueño ” [2]. Es decir, la HS se refiere a las
permiten aprender del entorno. Con el aprendizaje au- horas de sueño, pero también a todas aquellas acciones
tomático los programas ya no responden de una forma y/o actividades que se realizan mientras se está despier-
determinada a las entradas recibidas, sino que determi- to y que tienen un impacto en el descanso nocturno.
nan patrones de comportamiento a partir de las entradas Asociaciones médicas han determinado varios elementos
recibidas, los cuales son utilizados para generar la res- relacionados con la HS, los cuales pueden llegar a ser
puesta para nuevas entradas. De tal manera que la salida extensos. Además, no hay una certeza de que su control
será distinta cada vez que recibe la misma entrada, lo pueda incidir particularmente en la mejora de la calidad
que permite adaptarse a los cambios en el ambiente e de sueño de manera directa.
incluso predecir el comportamiento requerido para pro-
cesar nuevas entradas. El aprendizaje automático se ha Aprendizaje automático y calidad del
utilizado en muchas áreas y ha llegado a considerarse sueño
una herramienta muy útil en el diagnóstico de enferme- El aprendizaje automático se ha utilizado anteriormen-
dades. En este trabajo se muestra cómo el aprendizaje te para determinar la calidad del sueño e incluso diag-
automático puede llegar a ser útil para ayudar a dormir nosticar problemas del sueño. Entre los algoritmos de
mejor, es decir lograr una buena calidad de sueño, de- aprendizaje automático más utilizados en estos trabajos
terminando cuales son las actividades que más afectan se incluyen: Árboles de decisión (DT), Máquinas de vec-
a un individuo, las cuales pueden variar dependiendo de tores de soporte (SVMs), Algoritmo de los K vecinos más
cada persona y no siempre se está consciente de ellas. cercanos (kNN), así como regresión logística.
En la mayoría de los trabajos se realizan estudios so-
Antecedentes bre las señales emitidas por el cerebro, durante el sueño, y
La calidad del sueño (CS) es un concepto que ha to- de esa manera llevar a cabo un análisis de la información.
mado relevancia en los últimos años. La cantidad de En [3], [4] y [5] por ejemplo, se ha trabajado en sistemas
sueño es el tiempo durante el cual una persona perma- automáticos para la clasificación de las etapas del sueño,
nece dormida, mientras que la calidad de sueño es una mediante el análisis de señales provenientes de encefalo-
medida que indica cómo se percibe el sueño, incluyendo gramas. Recientemente hay varios trabajos que buscan
el sentirse descansado al momento de despertar [1]. Di- desarrollar sistemas automáticos para la detección de la
versos estudios han asociado a la CS con las principales apnea del sueño, un problema de respiración grave que
dimensiones del bienestar humano. Por ejemplo, se ha puede ocurrir al dormir, sin tener que recurrir al uso de
encontrado evidencia de su importancia a nivel cogniti- los estudios tradicionales, que pueden resultar intrusivos
vo al intervenir directamente en la consolidación de la para los pacientes, tal como la polisomnografía, la cual
memoria. Además, se ha demostrado que es durante las requiere que el paciente duerma en un entorno distinto
horas de sueño profundo cuando se produce la mayor al que acostumbra, conectado a una serie de sensores. En
cantidad de la hormona del crecimiento. Hoy se cuenta [6], en particular, se trabajó en un método para la detec-
con tecnología que permite monitorizar el sueño e infe- ción de apnea mediante el uso de algoritmos que permi-
rir si un individuo duerme con calidad o deficiencia. A ten el análisis de señales de electrocardiogramas (ECG).
partir de allí, es posible diagnosticar trastornos del sue- En [7] se utilizaron los algoritmos kNN y SVM para la
ño y apoyar con tratamientos adecuados para mejorar. determinación de las etapas del sueño como primer paso
La mayoría de los esfuerzos tecnológicos con relación en la detección de apnea. En dicho trabajo se realizaron
a mejorar la calidad de sueño de los individuos se han mediciones fotopletismográficas (PPG) que son las que se
centrado en la monitorización de las horas del sueño, sin utilizan en los teléfonos móviles, entre otros dispositivos,
embargo, existe un concepto también muy relacionado, para sustituir los ECG. Las señales PPG permiten me-
conocido como higiene del sueño (HS). La HS involucra dir la frecuencia cardíaca mediante un haz de luz y por
las horas en que la persona duerme, así como las activi- tanto pueden llegar a facilitar el estudio de los pacientes
dades previas y posteriores a la hora de dormir. HS se ya que son menos intrusivos.
© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691
Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 32 / 88

La higiene del sueño incluye aquellas acciones y/o actividades que se


realizan cuando se está despierto y que tienen un impacto en el descanso
nocturno.
Los trabajos anteriores están centrados en la medi- 5. Falta de sustento de un ambiente relajado para dor-
ción de la calidad del sueño, es decir, en el momento en mir (por ejemplo: colchón o temperatura incómo-
que el paciente está dormido. Sin embargo, el enfoque de da).
la higiene del sueño considera también las horas previas y
posteriores al sueño, mientras el paciente está despierto. Considerando estos elementos, en este trabajo se de-
En este aspecto hay menos trabajos que se han desarro- finió el concepto de Factor de la higiene del sueño (FHS),
llado, aunque cada día hay más interés en proporcionar los cuales pueden ser interpretados como datos de entra-
herramientas de apoyo para el usuario. Tal es el caso de da en un algoritmo que permita predecir cuales de ellos
[8], en el que se propone una casa inteligente, conforma- afectan más la CS en particular, esto se describe en las
da por distintos sistemas para el control de estrés y la siguientes secciones.
higiene del sueño, en la que se pueden llegar a utilizar
algunas técnicas de aprendizaje automático para propor- Metodología
cionar terapias que puedan tranquilizar a los usuarios y, Para determinar la aplicación de los algoritmos de apren-
en su momento, contribuir a mejorar la calidad de sueño. dizaje automático en la predicción de factores de higiene
En ese sentido, los algoritmos también pueden ser del sueño y su impacto en la calidad de sueño se realiza-
aplicados con información de las horas previas al sue- ron los siguientes pasos.
ño, y de esa manera alertar al usuario sobre actividades
que realiza, muchas veces sin darse cuenta, y que pueden 1) Estudio transversal.
llegar a influir en su calidad de sueño. 2) Determinación de FHS generales por medio de al-
En este trabajo se muestra como la higiene del sueño goritmos de aprendizaje automático.
puede representarse mediante una serie de factores, a los
que se ha denominado FHS (o Factores de la higiene del 3) Evaluación de los FHS con voluntarios y ajuste de
sueño). Además, se ha mostrado la efectividad del apren- resultados.
dizaje automático para la determinación de factores de
la higiene del sueño (FHS) personalizados y su impacto Estudio transversal
en la CS. El primer paso en este trabajo consistió en realizar un es-
tudio transversal para determinar factores de higiene del
Higiene del Sueño sueño que pueden utilizarse como valores de entrada en
un algoritmo de aprendizaje automático. La población
Un aspecto importante para lograr una buena calidad de
sueño es considerar las conductas mientras se está des- objetivo de este estudio estuvo compuesta por adultos
pierto que pueden afectar el tener un sueño reparador. De sanos (sin ningún trastorno del sueño) en edad produc-
acuerdo a la Sociedad Mundial del Sueño (World Sleep tiva (entre 20 y 70 años) y que además desean mejorar
Society) las conductas inadecuadas de higiene del sueño su calidad de vida, particularmente su calidad de sue-
se han dividido en 5 categorías, las cuales son: ño. La muestra se tomó en seis instituciones educativas
distribuidas geográficamente en el norte, centro y sur de
1. Horario de sueño inapropiado (por ejemplo: siesta México (Baja California, Nuevo León, San Luís Potosí,
e inestabilidad en horarios de dormir-despertar). Puebla, Yucatán y Chiapas). Se aplicó un cuestionario
compuesto de tres secciones, que incluía datos demográ-
2. Uso de productos para interrumpir el sueño (por ficos, así como cuestionarios de calidad del sueño exis-
ejemplo: cafeína y cigarrillos). tentes en la literatura (Pittsburgh Sleep Quality Index
(PSQI)[9], Sleep Hygiene Index (SHI)). Los cuestionarios
3. Actividades mentalmente estimulantes cercanas a se adaptaron al idioma español y se buscó incluir la ma-
la hora de acostarse (por ejemplo: planificación y yor cantidad de elementos relacionados a la higiene del
participación en trabajos emocionantes o emocio- sueño.
nalmente molestos). Participaron 164 mujeres y 140 hombres con un pro-
medio de 6.94 y 7.01 horas de sueño por noche respec-
4. Realización de actividades en la habitación diferen- tivamente. De acuerdo con la escala PSQI (Pittsburgh
tes a dormir (por ejemplo: mirar televisión y leer). Sleep Quality Index), 88 mujeres y 98 hombres tienen

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 33 / 88
buena calidad de sueño, mientras que 76 mujeres y 42 Determinación de factores predominantes con algoritmos
hombres reportaron carencias. de aprendizaje automatizado
Finalmente se determinaron 21 FHS que pueden afec- Debido a que 21 FHS es una cantidad considerable de ele-
tar la calidad del sueño en la población de estudio, los mentos a controlar, se buscó determinar un grupo más
cuales se muestran en la Tabla 1. reducido de factores generales de impacto para la pobla-
ción en particular, en este caso en México. Para ello se
Tabla 1. Definición de los Factores de la Higiene del implementó un proceso aplicando algoritmos de apren-
sueño. dizaje automático.
Característica FHS El proceso utilizó seis algoritmos de selección de va-
FHS1 Siestas riables, ya conocidos en el aprendizaje automático (Ran-
FHS2 Hora de dormir dom Forest, LASSO, Relief, Best First Search, Chi-
FHS3 Hora de despertar Square, Information Gain [10]), los cuales se basan en
FHS4 Ejercitar en la noche distintos métodos matemáticos y plantean diferentes cri-
FHS5 Ejercitar en la mañana terios de selección.
FHS6 Ejercitar en la tarde El método aplicado se compone de los siguientes pa-
FHS7 Tiempo en la cama sos:
FHS8 Tabaco
FHS9 Alcohol 1. Selección de características. Cada uno de los seis
FHS10 Cafeína algoritmos recibió los 21 factores como datos de
FHS11 Actividad antes de dormir entrada, de los cuales cada uno generó un subcon-
FHS12 Estrés antes de dormir junto óptimo, de acuerdo con sus propios criterios
FHS13 Usos de la cama de selección.
FHS14 Cama incomoda
FHS15 Luminosidad 2. Prueba de consistencia. Se implementaron pruebas
FHS16 Ruido de consistencia de cada algoritmo ejecutando múl-
FHS17 Frio tiples veces cada uno y comparando los subconjun-
FHS18 Calor tos obtenidos.
FHS19 Actividad intelectual antes de dormir
FHS20 Preocupaciones antes de dormir 3. Ordenación. En este paso, los factores de cada al-
FHS21 Cena goritmo se ordenaron de acuerdo con el peso (P)
que cada algoritmo les asignó. Después se extra-
Estos factores se deben considerar no sólo al momen- jeron los factores más significativos, es decir con
to de dormir, sino que es importante tenerlos en cuenta mayor peso.
en varios momentos del día para lograr una buena CS.
En la Figura 1 se muestra la línea del tiempo realizada 4. Mezcla. Finalmente, cada subconjunto se utilizó
para indicar cuando se debe considerar cada FHS. como entrada en un proceso de mezcla, en el cual
se seleccionaron los factores repetidos de cada lista.
Este último paso permitió identificar a los factores
predominantes según la población estudiada.
Después de aplicar el proceso descrito, se identifica-
ron tres factores como los predominantes:
FHS2: Hora de dormir,
FHS12: Estrés y
FHS20: Preocupaciones antes de dormir.
Validación de la selección de factores y ajuste
Con el fin de validar los tres FHS obtenidos anteriormen-
te y comprobar que son los que más impactan la calidad
de sueño de las personas en la población, se realizó un
estudio prospectivo con tres voluntarios. El estudio con-
sistió en recabar datos de la higiene del sueño y calidad
de sueño de cada participante durante un período de 30
días. Durante ese tiempo, los participantes llenaron cada
día un formulario contestando preguntas sobre cada uno
Figura 1. Línea del tiempo de los FHS. de los 21 factores de la higiene del sueño. Por ejemplo,
contestaron sí/no a preguntas como ¿ingeriste cafeína

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 34 / 88
dentro de las cuatro horas previas a dormir? o ¿Tomaste cantidad de movimiento, cantidad de veces que la perso-
una siesta mayor a 30 minutos el día de hoy? Por otra na se levantó durante la noche, ritmo cardíaco y ritmo
parte, la calidad del sueño se midió de forma objetiva respiratorio. El dispositivo evalúa la calidad de sueño en
mediante un dispositivo electrónico colocado debajo de una escala de 0 a 100 teniendo como punto de corte para
la sábana de la cama del participante (Marca: Beddit). determinar buena y mala calidad de sueño una puntua-
El dispositivo hace la estimación de calidad de sueño ción de 75.
utilizando seis parámetros: Latencia, tiempo de sueño,

Se comprobó que es posible predecir cuales FHS tienen más impacto en la


calidad de sueño de un individuo, utilizando algoritmos de aprendizaje
automático y un dispositivo que mide la calidad de sueño.
Se probaron tres algoritmos que han demostrado efi-
ciencia en la selección de características: XGBOOST,
LASSO y Random Forest (RF). El objetivo fue determi-
nar los FHS que permitieran obtener la calidad de sueño
(CS) medida con el dispositivo Beddit.
Se realizó un proceso con el fin de lograr una canti-
dad de registros suficientes para entrenar los algoritmos y
obtener conclusiones respecto de la generalización de los
resultados del estudio transversal. La validación de los
resultados se verificó mediante el coeficiente de determi-
nación (R2), el cual toma valores entre 0 y 1, entre más se
acerque a 1, el resultado es mejor. Se entrenó un modelo
por cada participante, utilizando como datos de entrada,
los FHS que se obtuvieron del estudio transversal como
factores críticos y se buscó un valor de R2 mayor que
0.90. Los resultados se compararon con los obtenidos de
la población para determinar si son generalizables.
Los resultados obtenidos no apoyan la hipótesis de
que con estos factores es posible construir modelos perso-
nales que estimen la calidad del sueño satisfactoriamente.
Para dos de los tres participantes los modelos generados Figura 2. Diagrama del modelo para determinar FHSs per-
a partir de los tres FHS obtuvieron valores de 0.50 y sólo sonalizados.
para uno de ellos el resultado está por encima de 0.70, el
mínimo requerido para considerar que un modelo explica Los resultados obtenidos para cada voluntario se
en una medida satisfactoria el fenómeno estudiado. muestran en la tabla 2. Las celdas centrales indican los
Posteriormente se propuso un nuevo algoritmo que FHS que impactan significativamente en cada volunta-
incluyó un proceso de selección de variables capaz de en- rio (V1, V2 y V3). Puede observarse, por ejemplo, que
contrar la mejor combinación de factores. El nuevo algo- al voluntario 3 (V3), los factores que más le afectan son
ritmo diseñado identifica factores primarios, secundarios SH7, SH13 y SH21, descritos de la siguiente manera por
y terciarios acorde a su impacto individual en la calidad el voluntario:
del sueño, la cual se verifica con el dispositivo Beddit SH7: Permanecer en la cama por las mañanas más
(ver Figura 2). tiempo de lo debido.
Este nuevo algoritmo combina características de XG- SH13: Usar la cama para trabajar en lugar de solo
BOOST, RF y LASSO permitiendo mezclar o expandir dormir.
el conjunto de factores críticos. La opción de mezclar SH21: Cenar platillos “pesados” cerca de la hora de
considera solo los factores que coindicen en todos los al- dormir.
goritmos, mientras que expandir incluye todos los facto- Si bien es cierto que estos resultados tienen la limi-
res del conjunto completo. El algoritmo posteriormente tante de utilizar datos extrapolados, permiten pensar
hace una búsqueda de la mejor combinación de factores. que es posible generar modelos personales para identi-
El criterio de paro es al llegar a R2 mayor o igual a 0.90. ficar FHS que impacten en la calidad de sueño de un

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 35 / 88
individuo a partir de la captura diaria de esos factores y
su calidad de sueño mediante un dispositivo electrónico.
Tabla 2. Definición de los Factores de la Higiene del
sueño. REFERENCIAS
VE V1 V2 V3 1. Pilcher, J.J., Ginter, D.R., y Sadowsky, B. (1997). Sleep quality
versus sleep quantity: relationships between sleep and measures
FHS FHS6, FHS2, FHS7, of health, well-being and sleepiness in college students. Journal
FHS FHS7 FHS7, FHS13, of psychosomatic research, 42(6), 583-596.
FHS FHS20 FHS15, FHS21 2. Khazaie, H., Chehri, A., Sadeghi, K., Heydarpour, F., Soleima-
FHS FHS16 ni, A., y Rezaei, Z. (2016). Sleep Hygiene Pattern and Behaviors
R2 0.94 0.96 0.90 and Related Factors among General Population in West Of Iran.
Global Journal of Health Science, 8(8).
3. Satapathy, S.K., Bhoi, A.K., Loganathan, D., Khandelwal, B., y
Conclusiones Barsocchi, P. (2021). Machine learning with ensemble stacking
model for automated sleep staging using dual-channel EEG sig-
nal. Biomedical Signal Processing and Control, 69, 102898.
Los algoritmos de aprendizaje automático tienen como
objetivo detectar patrones, de manera que se puedan 4. Gunnlaugsson, E., Ragnarsdottir, H., Prainsson, H. M., Finns-
hacer predicciones y/o clasificaciones a partir de datos son, E., Jonsson, S. A. E., Helgadottir, H., y Herman, P. (2019).
End-to-end machine learning on raw eeg signals for sleep stage
anteriores. En la actualidad tienen muchas aplicaciones, classification. Sleep Medicine, 64, S139-S139.
entre ellas en la salud, en donde incluso se han utilizado 5. Chriskos, P., Kaitalidou, D. S., Karakasis, G., Frantzidis, C.,
como apoyo para el diagnóstico médico. Gkivogkli, P. T., Bamidis, P., y Kourtidou-Papadeli, C. (2017).
En este trabajo se muestra la utilidad del aprendiza- Automatic sleep stage classification applying machine lear-
ning algorithms on EEG recordings. En 2017 IEEE 30th In-
je automático para lograr una buena calidad de sueño. ternational Symposium on Computer-Based Medical Systems
Se describe cómo algunos algoritmos se han utilizado, en (CBMS), 435-439.
particular para llegar a detectar algunos padecimientos 6. Bozkurt, F., Uçar, M. K., Bozkurt, M. R., y Bilgin, C. (2020).
que se pueden presentar durante el sueño. Además, se Detection of abnormal respiratory events with single channel
ECG and hybrid machine learning model in patients with obs-
presenta el trabajo realizado para determinar los facto- tructive sleep apnea. Irbm, 41(5), 241-251.
res de la higiene del sueño que tienen un mayor efecto 7. Uçar, M.K., Bozkurt, M.R., Bilgin, C., y Polat, K. (2018). Au-
en la calidad del sueño en la población mexicana. Ini- tomatic sleep staging in obstructive sleep apnea patients using
cialmente se identificaron 21 FHS a través de un estudio photoplethysmography, heart rate variability signal and machi-
ne learning techniques. Neural Computing and Applications,
en la población, posteriormente con la aplicación de los 29(8), 1-16.
algoritmos y un proceso robusto de selección de varia-
bles se identificaron tres FHS. Los factores resultantes 8. Leonidis, A., Korozi, M., Sykianaki, E., Tsolakou, E., Kourou-
malis, V., Ioannidi, D., y Stephanidis, C. (2021). Improving
en este caso son: Hora de dormir, estrés y preocupacio- Stress Management and Sleep Hygiene in Intelligent Homes.
nes antes de dormir. En un inicio se consideró que estos Sensors, 21(7), 2398.
tres FHS podrían generalizarse para la población de estu- 9. Buysse, D. J., Reynolds III, C. F., Monk, T. H., Berman, S.
dio en particular, sin embargo, el estudio realizado reveló R., y Kupfer, D. J. (1989). The Pittsburgh Sleep Quality In-
dex: a new instrument for psychiatric practice and research.
que cada persona tiene FHS distintos que le afectan más. Psychiatry research, 28(2), 193-213.
Un algoritmo adecuado pudo llegar a determinar los es- 10. Laflor Hernández, A. J. (2018). Adaptive model to predict sleep
pecíficos para cada persona, lo que puede contribuir en quality from the personalized selection of sleep hygiene factors.
la generación de hábitos que promuevan la calidad de Tesis de doctorado, Universidad Autónoma de Baja California,
Repositorio institucional Universidad Autónoma de Baja Cali-
sueño, que tiene tanto impacto en la salud.✵ fornia.

SOBRE LOS AUTORES

Mabel Vázquez Briseño es profesora-investigadora en la Universidad Autónoma de Baja Califor-


nia, México. En 2008 recibió el grado de Doctor en Computación por el INT en colaboración con la
Universidad Pierre et Marie Curie en Paris, Francia.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 36 / 88

Arturo Laflor-Hernandez realizó estudios de doctorado en la Universidad Autónoma de Baja Cali-


fornia. Sus áreas de interés incluyen: Aprendizaje automático, interacción humano-computadora móvil
y bioingeniería.

Juan Iván Nieto Hipólito recibió el grado de Doctor en Arquitectura y Tecnologías de Computadora
por la Universidad Politécnica de Cataluña en Julio de 2005. Actualmente es profesor-investigador en
la Universidad Autónoma de Baja California, en Ensenada, México.

Christian X. Navarro recibió el grado de doctor por la Universidad Castilla - La Mancha en 2016.
Actualmente es profesor-investigador en la Universidad Autónoma de Baja California. Sus áreas de
interés son: cómputo móvil e interacción humano-computadora.

Juan de Dios Sánchez López obtuvo el grado de Maestro en Ciencias en Electrónica y Telecomuni-
caciones por parte del Centro de Investigación Científica y Educación Superior de Ensenada (CICESE)
en 1999 y el grado de Doctor en Ciencias en Electrónica y Telecomunicaciones.

Imagen tomada de: https://transmitter.ieee.org/.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 37 / 88
ARTÍCULO ACEPTADO
La Inteligencia Artificial para Predicción de la
Recuperación en la Enfermedad Vascular Cerebral
Ruben I. Carino-Escobar y Jessica Cantillo-Negrete
La enfermedad vascular cerebral y sus re- hemorrágica). Estos eventos que dan origen a la EVC
percusiones sociales ocurren, generalmente, en un solo hemisferio del cerebro,
La mayor parte de las personas pasamos por alto las y pueden ocasionar desde discapacidad hasta la muerte.
avanzadas capacidades cognitivas y motrices que los se- La discapacidad ocasionada como secuela de la EVC
res humanos desarrollamos a lo largo de nuestra vida. La puede tener componentes de lenguaje como la afasia (los
habilidad de tomar un vaso de agua y beber su conteni- pacientes pueden decir la palabra “si” cuando en reali-
do, cruzar una calle caminando, o realizar operaciones dad quieren decir la palabra “no”) y componentes de
matemáticas en nuestra mente, son en realidad produc- movimiento, como la hemiparesia (incapacidad de mover
to de complejos procesos que ocurren en nuestro sistema un lado del cuerpo, desde la mitad del rostro hasta el
nervioso central, y que tienen su origen en el cerebro. movimiento de los dedos de un pie). La hemiparesia con-
El sistema nervioso central nos permite dictar a nues- tribuye en gran medida a la discapacidad de pacientes
tro cuerpo, cómo es que debemos realizar nuestras acti- con EVC. Es difícil que una persona realice sus activida-
vidades cotidianas. Sin embargo, al igual que con cual- des cotidianas si no puede mover uno de sus brazos, usar
quier sistema complejo, este puede presentar fallas. Estas una de sus piernas para caminar u ocupar una de sus
fallas, conocidas como enfermedades neurológicas, pue- manos para preparar sus alimentos. Se estima que alre-
den ser ocasionadas por diversos eventos. La enfermedad dedor de 101.5 millones de personas viven con secuelas
vascular cerebral (EVC) es una de estas enfermedades de una EVC en el mundo, esto es similar a la suma de la
neurológicas, la cual es ocasionada por un daño en el te- población de Argentina, Chile, Perú y Uruguay. Por lo
jido cerebral (lesión). Este daño puede ser producto de que, no es de sorprender que la EVC se encuentre entre
una obstrucción de un vaso sanguíneo dentro del cerebro las primeras 10 causas de discapacidad a nivel mundial
ocasionado por un coágulo o exceso de grasa (EVC is- [1].
quémica) o, por la ruptura de un vaso sanguíneo (EVC

La inteligencia artificial proporcionará pronósticos de recuperación que


mejoren la planeación de programas de rehabilitación.
El pronóstico de la EVC La recuperación posterior a una EVC, sobre todo del
Imaginemos que un día una persona que tiene diabe- movimiento depende de varios factores. El principal fac-
tes e hipertensión no controladas (condiciones que están tor es la neuroplasticidad, que es la adaptabilidad del
asociadas con un mayor riesgo de padecer una EVC [1]) tejido cerebral para reorganizarse como producto de un
intenta levantarse de su cama en la mañana, pero se tam- proceso de aprendizaje (como cuando aprendemos a co-
balea y posteriormente, cae en el piso porque no puede dificar en un nuevo lenguaje de programación), o para
mover la mitad del cuerpo, intenta pedir ayuda, pero no compensar una lesión (como la que origina una EVC).
puede hablar, e intenta hacer ruido hasta que alguien La pérdida del movimiento sucede porque la conexión de
llega a auxiliarlo. neuronas entre la corteza del cerebro (donde se origina
Después de que la persona es trasladada a un hos- el movimiento) y una extremidad (como la mano para-
pital y una vez realizados estudios con imágenes médi- lizada) puede ser afectada por la lesión. Esta conexión
cas, le confirman el diagnóstico de una EVC. En algún es conocida como el tracto corticoespinal, y se cree que
momento la persona pensará: ¿Me podré recuperar com- la neuroplasticidad, promovida por la terapia, remodela
pletamente? Sin embargo, la respuesta a esta pregunta el tejido cerebral para recuperar la funcionalidad de esta
es algo que todavía no puede responderse con certeza, conexión. En la Figura 1 se puede observar la recons-
incluso por personal médico experto que planea el tra- trucción tridimensional del cerebro de una persona que
tamiento de estos pacientes [2]. ¿Por qué no podemos padece una EVC. El tracto corticoespinal se vio afectado
predecir adecuadamente si una persona se recuperará de en el hemisferio cerebral derecho del paciente por la le-
una EVC? sión y ello provocó una parálisis total en el brazo y mano

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 38 / 88
izquierda del paciente. La parálisis de la extremidad su- de la extremidad superior paralizada genera un acceso
perior provoca una gran discapacidad y en este tipo de desigual a los servicios de rehabilitación, afectando la
discapacidad se centrará este trabajo. posibilidad de recuperación de los pacientes, lo cual li-
La evidencia científica actual dicta que la recupera- mita su independencia y afecta su calidad de vida a nivel
ción del movimiento dependerá de qué tan dañado esté el personal, familiar, social, y laboral [2].
tracto corticoespinal, lo cual, generalmente, es evaluado
indirectamente con escalas que consisten en inspeccionar La Inteligencia Artificial como una solu-
si el paciente puede realizar ciertas tareas que involucran
el movimiento de las extremidades. Estas escalas clíni-
ción para el pronóstico de la EVC
cas son aplicadas por médicos especialistas en rehabili- Ya hemos establecido que el pronóstico de la recupera-
tación. La integridad del tracto corticoespinal también ción de las secuelas motoras de una EVC es una tarea
puede evaluarse usando mediciones fisiológicas, como las compleja porque depende de diversos factores. Es por ello
imágenes médicas obtenidas en equipos sumamente com- que, en los últimos 5 años, la inteligencia artificial ha to-
plejos como lo es un resonador magnético. Así como, por mado un papel central para esta predicción. A diferencia
medio de un campo magnético de gran potencia que es- de un ser humano, los algoritmos de inteligencia artificial
timula las neuronas en la corteza cerebral y transmiten pueden realizar predicciones considerando un gran nú-
la señal de movimiento a la mano; este estudio se conoce mero de variables relacionadas con la recuperación. Pero
como estimulación magnética transcraneal. esta predicción será mejor si se tiene más información
relacionada a esta recuperación. Es decir, si se tiene la
“experiencia” de cómo se recuperaron pacientes con EVC
y las mediciones asociadas a esta recuperación. Aunque
aún no existe un método universalmente aceptado para
predecir la recuperación del movimiento de la mano en
una EVC, sí existen estudios de investigación que han
propuesto diferentes soluciones para este problema. En
este artículo se abordan tres de los más actuales.
El modelo PREP2
La investigadora Cathy M. Stinear es una de las autoras
más reconocidas en el tema de la predicción de la re-
cuperación del movimiento de la mano de pacientes con
EVC. Su grupo de investigación propuso predecir la re-
cuperación de movimiento de la mano paralizada usando
un algoritmo conocido como árboles de decisión. Los ár-
boles de decisión consisten en un modelo en el cual la
interpretación de la relación de ciertas variables (como
Figura 1. Reconstrucción tridimensional del cerebro de un la edad) con la recuperación, es simple de entender, y
paciente con EVC usando una secuencia de resonancia mag- aun así permite usar un gran número de variables pa-
nética “FLAIR”. A) Vista axial mostrando la lesión, o tejido ra predecir la recuperación medida con escalas clínicas.
cerebral dañado, en coloración blanca más intensa que el Los árboles de decisión en realidad usan una analogía
resto del cerebro. B) Vista coronal mostrando la lesión. del pensamiento humano para tomar decisiones, toman-
do una decisión a la vez y ramificando cada decisión en
La recuperación también dependerá de la capacidad otras dos decisiones.
del cerebro para generar conexiones alternas por medio Aplicado al pronóstico de la recuperación del movi-
de la neuroplasticidad. La cual depende de factores como miento de la mano, el algoritmo que entrena o calibra
la edad, la cantidad de tejido cerebral disponible para el árbol de decisión evaluó preguntas como: ¿el pacien-
hacer nuevas conexiones, la cantidad de terapia realizada te tenía más de 80 años? ¿Su mano paralizada era la
por el paciente en etapas tempranas de la enfermedad y dominante? ¿Es hombre o mujer? ¿Qué nivel de disca-
los patrones de actividad en el cerebro que se originan pacidad clínica presentaba? ¿Tenía integridad del tracto
mientras los pacientes intentan mover sus extremidades corticoespinal en su hemisferio lesionado? Posteriormen-
afectadas. Por lo tanto, debido a que depende de tantos te, se eligió el árbol que tuvo un mejor desempeño, el
factores, el pronóstico de la recuperación del movimien- cual estimó correctamente la recuperación del 75 % de
to en una EVC es sumamente difícil. Y, sin embargo, un total de 207 pacientes a las 12 semanas posteriores a
es sumamente importante, ya que se ha observado que la predicción. Para alcanzar esta predicción solo usó las
el pronóstico erróneo de recuperación del movimiento preguntas de la edad, la integridad del tracto corticoespi-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 39 / 88
nal y el nivel de discapacidad medido de forma separada [5]. Para realizar la predicción se usaron tres variables
con dos escalas clínicas [3]. La estructura de este árbol demográficas (la edad, el sexo y la dominancia manual);
de decisión se muestra en la Figura 2. tres variables clínicas (tiempo desde inicio de la EVC,
hemisferio cerebral lesionado, y la función motora antes
del proceso de recuperación); dos mediciones derivadas
de estimulación magnética transcraneal (diferencia de
potencia del campo magnético necesaria para estimular
las manos derecha e izquierda y si fue posible hacer la
estimulación en la mano afectada); y la falta de cone-
xión entre 86 regiones del cerebro medida con estudios
de resonancia magnética. En total, se obtuvieron 93
variables antes y después de una intervención terapéu-
tica. Los autores aplicaron cinco métodos diferentes de
aprendizaje máquina para predecir la recuperación ob-
servada después de la intervención terapéutica, siendo
este un problema de regresión, es decir, se estimaron
los valores futuros que los pacientes obtendrían con la
Figura 2. Algoritmo PREP2 para estimar a 12 semanas de escala clínica de interés (la prueba de Fugl-Meyer para
iniciada la enfermedad el nivel de recuperación del movimien- miembro superior [6]). Estos métodos fueron, el previa-
to de la extremidad superior de pacientes con EVC. mente mencionado, árbol de regresión, bosque aleatorio
[7], máquinas de soporte vectorial, redes neuronales y
Podemos observar que la recuperación del movimien- regularización del tipo “elastic-net” [8]. Los dos métodos
to de la mano se pronóstica por medio del árbol de que tuvieron un mejor desempeño para predecir la re-
decisión usando cuatro categorías. Por ejemplo, para cuperación fueron la regularización del tipo “elastic-net”
que la recuperación sea excelente, el paciente debe de te- (predijo en un 91 % los cambios observados en la recupe-
ner algo de capacidad de mover los dedos o el antebrazo, ración), y el bosque aleatorio (88 %). Se concluyó que el
y su edad debe ser menor a 80 años, o si es mayor a 80 éxito de la regularización tipo “elastic-net” y el bosque
años, la discapacidad medida de forma clínica no debe de aleatorio se debió a que, el primero permite eliminar
ser mayor que una discapacidad moderada. El grupo de del modelo y ponderar las variables que tienen mayor
investigación de la Dra. Stinear le dio seguimiento a 86 utilidad para la predicción, mientras que los bosques
de los 207 pacientes que originalmente participaron en el aleatorios combinan varios árboles de regresión (o de
estudio y se comprobó que para 69 de ellos, la predicción decisión para clasificación) para crear un modelo en el
del algoritmo PREP2 era válida a los 2 años posteriores cual todas las variables, de acuerdo con su importancia,
de haber realizado la predicción. Por lo tanto, se compro- contribuyan a la solución de la predicción. Por lo tanto,
bó la utilidad del pronóstico para evaluar la recuperación los métodos que realizaron una mejor predicción fueron
a largo plazo del movimiento de la extremidad superior, aquellos capaces de trabajar con muchas variables, ya
usando un árbol de decisión [4]. Una de las restricciones sea ponderando la importancia de cada variable para la
del modelo PREP2 es que se requiere realizar pruebas predicción o, eliminando variables no relacionadas con
a unos días después del inicio de la EVC, siendo esto la recuperación. Esto también permite deducir que no
no siempre posible porque la salud de los pacientes aún todas las variables tendrán una contribución significa-
no es estable. Además, equipos como un estimulador tiva para la predicción, por lo que, la identificación de
magnético transcraneal, no se encuentran disponibles variables asociadas con la recuperación permitiría una
en los hospitales donde se atienden la mayor parte de mejor predicción.
los pacientes con EVC durante los primeros días de la
enfermedad. Por ello, se han propuesto otras formas de
pronóstico basadas en inteligencia artificial con variables Ensambles de árboles de regresión para
que pueden ser recabadas semanas o meses después del predicción de la recuperación usando úni-
inicio de la EVC. camente variables fisiológicas
La mayor parte de los estudios que abordan la predicción
Técnicas de regresión para predecir la re- de la recuperación del movimiento en pacientes con EVC,
cuperación de la mano usando un gran utilizan variables demográficas (como la edad) y clínicas
número de variables (como el puntaje de la prueba de Fugl-Meyer). Un estu-
En el estudio de Tozlu y sus colaboradores pronosticaron dio realizado por el grupo de investigación liderado por
la recuperación del movimiento de la mano paralizada la Dra. Jessica Cantillo-Negrete, abordó el problema de
usando información de 3 a 12 meses de iniciada la EVC pronosticar la recuperación, pero únicamente con varia-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 40 / 88
bles extraídas de mediciones fisiológicas [9]. ¿Por qué es meses antes de participar en el estudio. Y recibieron una
esto relevante? Porque que no todas las bases de datos intervención experimental con duración de 30 días. Antes
de pacientes con EVC tienen la misma información de- de iniciar la intervención, se midió la actividad eléctrica
mográfica, y porque las instituciones de salud aplican del cerebro, usando una técnica llamada electroencefalo-
diferentes escalas clínicas para evaluar la discapacidad grafía, mientras los pacientes intentaban mover su mano
posterior a una EVC; además, estas pruebas clínicas pue- paralizada. Además, se determinó la integridad del tracto
den presentar variabilidad de acuerdo con la experiencia corticoespinal medida con estimulación magnética trans-
del personal médico que las realiza. Por ello, se efectuó el craneal, la fuerza de los dedos de los pacientes al realizar
pronóstico de recuperación del movimiento de la mano de una tarea de sujeción con todos los dedos (pinza grue-
pacientes con EVC únicamente con variables derivadas sa) y la fuerza del pulgar y el dedo índice (pinza fina).
de mediciones fisiológicas. Se utilizó un ensamble de árboles de regresión (similar a
bosques aleatorios, pero con modificaciones) para poder
predecir la recuperación motora y para identificar cuáles
de las 52 variables fisiológicas extraídas contribuyeron
más a la recuperación, la cual fue medida con dos esca-
las clínicas distintas. El ensamble de árboles de regresión
propuesto, en esencia, permitió que las variables usadas
para la predicción fueran clasificadas de acuerdo con su
importancia (cuantas veces fueron usadas para decisio-
nes dentro de los árboles que formaron al ensamble). La
Figura 3 muestra las mediciones fisiológicas usadas para
la predicción.
El resultado fue que la metodología propuesta tuvo
una buena predicción para la recuperación medida con
la escala clínica Fulg-Meyer para miembro superior, que
evalúa la capacidad de los pacientes de realizar movi-
mientos con su mano afectada, ya que en un 85 % de
los casos analizados se obtuvo una predicción correcta.
Mientras la predicción fue aceptable para la escala clíni-
ca Action Research Arm Test, que evalúa la capacidad
de los pacientes de realizar tareas con la mano afectada,
puesto que un 60 % de los casos analizados tuvieron una
predicción correcta. Las predicciones en donde el algo-
ritmo tuvo un mayor error fueron aquellas en las que los
pacientes tuvieron una recuperación muy alta. La expli-
cación a este fenómeno fue que ninguna de las variables
usadas para la predicción estuvo asociada con los proce-
sos de neuroplasticidad que ocurrieron en los pacientes
con una recuperación muy alta, y quizás la evidencia
de estos procesos pueda observarse únicamente durante
la terapia de rehabilitación y no antes. Una observación
interesante derivada del estudio fue que, para la esca-
la que evalúa la capacidad de realizar movimientos de
la extremidad superior, la actividad eléctrica relaciona-
da al movimiento en ambos hemisferios fue la que más
información aportó a la predicción. Mientras que para
la escala que evalúa la capacidad de hacer tareas con la
Figura 3. Ejemplificación de los ensambles de árboles de mano afectada (como colocar un bloque de madera sobre
regresión y representación de las variables fisiológicas usadas una repisa) las variables de la integridad del tracto cor-
para pronosticar la recuperación del movimiento de la mano ticoespinal y la fuerza de la mano afectada tuvieron una
paralizada de pacientes con EVC. contribución significativa para la predicción. Por lo tan-
to, aunque aún deben de identificarse variables que tie-
En el estudio participaron 10 pacientes del Instituto nen asociación con la recuperación, es posible predecir la
Nacional de Rehabilitación “Luis Guillermo Ibarra Iba- recuperación del movimiento de la extremidad superior
rra”. Los pacientes habían iniciado con la EVC entre 3 y 9 paralizada de los pacientes únicamente usando variables

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 41 / 88
fisiológicas. El algoritmo de inteligencia artificial usado con las actividades realizadas, durante la valoración clí-
para la predicción debe de tener la capacidad de ponde- nica que se desea pronosticar.
rar la contribución de las variables fisiológicas asociadas

La discapacidad generada por la enfermedad vascular cerebral tiene


grandes repercusiones sociales a nivel mundial.
Conclusiones 2. Stinear, C., Byblow, W., Ackerley, S., et al. (2017). Predic-
ting Recovery Potential for Individual Stroke Patients Increases
La inteligencia artificial se perfila a jugar un papel cen- Rehabilitation Efficiency. Stroke, 48(4), 1011-1019.
tral en la tarea del pronóstico de la recuperación del
movimiento de la mano de pacientes con EVC. Los mo- 3. Stinear, C., Byblow, W., Ackerley, S., et al. (2017). PREP2: A
biomarker-based algorithm for predicting upper limb function
delos computacionales usados para la predicción han after stroke. Annals of Clinical and Translational Neurology,
aumentado su complejidad para permitir que variables 4(11), 811-820.
derivadas de mediciones de diversa naturaleza, como 4. Smith, M., Ackerley, S., Barber, P., et al. (2019). PREP2 Algo-
la integridad del tracto corticoespinal y la fuerza de rithm Predictions Are Correct at 2 Years Poststroke for Most
la mano paralizada, aporten información para resolver Patients. Neurorehabilitation and Neural Repair, 33(8), 635-
642.
el problema de pronóstico. Es posible que en el futuro
puedan desarrollarse y validarse sistemas expertos, que 5. Tozlu, D., Edwards, D., Boes, A., et al. (2020). Machine Lear-
ning Methods Predict Individual Upper-limb Motor Impairment
permitan al personal clínico planear de mejor forma los Following Therapy in Chronic Stroke. Neurorehabilitation and
programas de rehabilitación para personalizarlos a las Neural Repair, 34(5), 428-439.
necesidades específicas de cada paciente.✵ 6. Gladstone, D., Danells, C., Black, S., et al. (2002). The Fugl-
Meyer Assessment of motor recovery after stroke: a critical re-
view of its measurements properties. Neurorehabilitation and
Neural Repair, 16(3), 232-240.
Agradecimientos 7. Breiman, L. (2001). Random Forests. Machine Learning, 45(1),
Se reconoce el apoyo de CONACYT por el financia- 5-32.
miento otorgado al proyecto SALUD-2018-02-B-S-45803.
8. Zou, H., y Hastie, T. (2005). Regularization and variable selec-
tion via the elastic net. Journal of the Royal Statistical Society:
Series B (Statistical Methodology), 67(2), 301-320.
REFERENCIAS 9. Carino-Escobar, R., Valdés-Cristerna, R., Carrillo-Mora, P., et
1. Virani, S., Alonso, A., Aparicio, H., et al. (2021). Hearth Di- al. (2021). Prognosis of stroke upper limb recovery with phy-
sease and Stroke Statistics-2021 Update. Circulation, 143(8), siological variables using regression tree ensembles. Journal of
254-743. Neural Engineering, 18(4), 1-14.

SOBRE LOS AUTORES


Ruben I. Cariño Escobar obtuvo el grado de Doctor en Ciencias en Ingeniería Biomédica de la
Universidad Autónoma Metropolitana, Unidad Iztapalapa. Actualmente, está adscrito a la División
de Investigación en Ingeniería Médica del Instituto Nacional de Rehabilitación “Luis Guillermo Ibarra
Ibarra”. Es miembro del Sistema Nacional de Investigadores en el Nivel I. Sus intereses científicos
incluyen la aplicación de la inteligencia artificial para el diagnóstico y tratamiento de enfermedades
neurológicas y, el desarrollo de interfaces cerebro-computadora.
Jessica Cantillo Negrete obtuvo el grado de Doctora en Ciencias en Ingeniería Eléctrica con especia-
lidad en Bioelectrónica por parte del CINVESTAV. Actualmente, es investigadora en ciencias médicas
adscrita a la División de Investigación en Ingeniería Médica del Instituto Nacional de Rehabilitación
“Luis Guillermo Ibarra Ibarra”. Es miembro del Sistema Nacional de Investigadores en el Nivel I. Sus
intereses científicos incluyen el procesamiento digital de señales fisiológicas, la neurorrehabilitación, y
el desarrollo de interfaces cerebro-computadora.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 42 / 88
ARTÍCULO ACEPTADO
Enfoque Evolutivo de Aprendizaje de Máquina en
la Identificación y Control de Sistemas
Alejandro Rodríguez-Molina, Miguel G. Villarreal-Cervantes, Miguel Ángel Paredes-Rueda y Carlos
Alberto Guerrero-León
Identificación y control de sistemas los niveles del acelerador y el freno. Todo modelo posee
Los Sistemas Dinámicos (SD) han acompañado a la hu- parámetros ajustables que determinan la precisión con la
manidad desde sus inicios. Una característica de los SD que se puede representar a un sistema real. En el ejemplo
es que su comportamiento cambia con el tiempo. En la de la Figura 1, los parámetros del modelo consideran la
actualidad, los seres humanos nos vemos rodeados de to- potencia del motor, la rigidez de la suspensión, las ma-
da clase de SD en forma de herramientas, computadoras, sas e inercias, y otros parámetros de tipo aerodinámico.
electrodomésticos, máquinas y redes sociales, entre una Entonces, un modelo que represente fielmente a un au-
vasta cantidad de ejemplos, por lo que es innegable la tomóvil de carreras tendrá un motor de mayor tamaño
relevancia que tienen en el avance de la sociedad. y una suspensión más fuerte y rígida, será más ligero,
Por otro lado, los retos de la sociedad actual (como y poseerá mejores características aerodinámicas que uno
el cambio climático, la sostenibilidad, la salud y la mo- fabricado para transitar en la ciudad.
vilidad) demandan una explotación adecuada de los SD, Para algunos SD, existen principios universales que
de manera que éstos sean capaces de otorgar mayores permiten derivar las relaciones matemáticas entre sus en-
beneficios al menor costo posible. tradas y salidas, por ejemplo, las leyes de Newton. Para
Para lograrlo, los comportamientos de los SD deben muchos otros, no existe esta ventaja, pero las relacio-
gobernarse adecuadamente. La ingeniería de control es nes se pueden describir con estructuras matemáticas o
la responsable del diseño y ajuste de estrategias para go- computacionales diversas. La dificultad en la obtención
bernar los comportamientos de los SD de manera que de un modelo preciso de un SD radica en el ajuste de sus
cumplan con requerimientos definidos [1]. Ambas tareas parámetros.
(el diseño y ajuste) son complejas y la eficacia en su La identificación de sistemas es una metodología para
desarrollo depende de una abstracción precisa del SD encontrar modelos precisos de los SD utilizando medidas
conocida como modelo. reales de sus entradas y salidas [2]. Para esto, las en-
tradas y salidas del sistema real se miden durante un
periodo de tiempo (a través de sensores); se selecciona
o deriva la estructura del modelo; se utiliza un método
de estimación sobre los datos de entrada y salida pa-
ra encontrar los valores de los parámetros del modelo
(usando un método numérico); y el modelo ajustado se
evalúa para determinar si satisface las necesidades de la
aplicación.
Un modelo identificado correctamente, puede utili-
zarse para realizar predicciones sobre la respuesta que
tendría el SD real. De esta forma, se puede realizar cual-
quier experimento o prueba sobre el modelo, principal-
mente aquellos orientados a diseñar o ajustar estrategias
de control para gobernar su comportamiento, antes de
Figura 1. Modelo de un automóvil. llevarlos a cabo en el sistema real, evitando gastos exce-
sivos o riesgos.
El modelo representa el comportamiento de un SD, Actualmente, existe una cantidad inmensa de estra-
describiendo las relaciones entre sus entradas y salidas tegias de control para gobernar SD sujetos a condiciones
a través del lenguaje matemático (utilizando expresio- de operación diversas, y cada una posee parámetros que
nes algebraicas o ecuaciones). La Figura 1 muestra un condicionan su rendimiento. El ajuste de los parámetros
ejemplo del modelo de un automóvil cuyas salidas de de control es un problema importante conocido como
velocidad y aceleración se relacionan con los valores de sintonización. La sintonización utiliza un modelo preci-
entradas como el estado del arrancador, el embrague y so del SD para probar diferentes configuraciones hasta

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 43 / 88
encontrar la más conveniente [3]. El número de configu- CRISP-DM considera seis fases que se desarrollan al-
raciones es inconmensurable, dándonos una idea de la rededor de los datos para construir y desplegar el modelo
complejidad de esta tarea. de un negocio (Figura 2). Estas fases son:
Aprendizaje de máquina y cómputo evo- 1. La comprensión del negocio: Se estudian los porme-
lutivo nores del negocio y se identifican sus necesidades.
En las últimas décadas, la Inteligencia Artificial (IA) ha
contribuido a encontrar soluciones a problemas comple- 2. La comprensión de los datos: Se analizan los flujos
jos [4]. El Aprendizaje de Máquina (AM) es un área de la de datos alrededor del negocio.
computación que construye modelos de fenómenos, pro- 3. La preparación de los datos: Los datos del negocio
cesos o sistemas, a partir de datos sobre ellos [5], e incluye se recolectan y se ponen en un formato útil para el
técnicas para hacer que un modelo aprenda de los datos. modelado.
Dependiendo del nivel de supervisión humana, el AM
puede ser supervisado, semisupervisado, no supervisado 4. El modelado: Se seleccionan y aplican técnicas para
y por reforzamiento. obtener modelos candidatos ajustados.
En el contexto de los SD, el proceso de identificación
se alinea con el aprendizaje supervisado, y construye un 5. La evaluación: Se verifica la calidad de los modelos
modelo predictor con base en un conjunto de caracte- y se selecciona aquel que mejor ayuda a alcanzar
rísticas (entradas reales del sistema) y otro de etiquetas los objetivos del negocio.
(salidas reales del sistema). Este predictor se puede des-
plegar para realizar predicciones en los procesos de diseño 6. El despliegue: El mejor modelo se utiliza como so-
o sintonización de estrategias de control. porte en la toma de decisiones para alcanzar los
La ventaja de que estas dos líneas compartan carac- objetivos del negocio.
terísticas, es que pueden adoptarse metodologías más efi-
caces del AM en el desarrollo de tareas complejas, como Dentro de CRISP-DM, existen fases que necesitan
la identificación de SD y la sintonización de estrategias realizar búsquedas complejas. La más clara es la fase de
de control, para incrementar la probabilidad de éxito. modelado, en donde los parámetros del modelo deben
CRISP-DM (del inglés CRoss-Industry Standard Process ajustarse de forma precisa utilizando los datos para que
for Data Mining ) [6], es una metodología de AM exitosa éste represente a la realidad de la mejor manera. Depen-
que ha sido explotada en una gran diversidad de áreas diendo del tamaño de los datos, el número de parámetros
como biología, contabilidad, e ingeniería. del modelo y la complejidad de su estructura, el ajuste
realizado en esta fase puede llegar a ser muy complicado,
más aún si se considera que el número de combinaciones
en los valores de estos parámetros puede ser infinito.
El proceso de aprendizaje en AM se ha apoyado exi-
tosamente en técnicas de cómputo inteligente, como las
metaheurísticas, para resolver problemas de una gran va-
riedad de aplicaciones, en donde los algoritmos clásicos
de aprendizaje no pueden encontrar soluciones suficiente-
mente buenas. Las metaheurísticas son métodos de bús-
queda computacionales y estocásticos que pueden encon-
trar soluciones buenas a problemas complejos utilizando
una cantidad asequible de recursos. Una gran parte de
estos métodos pertenece al área de Cómputo Evolutivo
(CE) [7].
El CE incluye algoritmos de búsqueda bioinspirados
en la evolución natural de las especies según el Neodar-
winismo. El planteamiento del Neodarwinismo acerca de
la evolución se ejemplifica en la Figura 3 para las jirafas.
En las técnicas de CE, los individuos son soluciones
candidatas (en forma de vectores o colecciones de núme-
ros) a un problema cuya aptitud se mide utilizando un
criterio de desempeño (un valor escalar). En cada genera-
Figura 2. Flujo de actividades en la metodología CRISP- ción, las soluciones de una población pueden combinarse
DM. con otras o mutar (usando operaciones vectoriales), y

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 44 / 88
aquellas con una mejor aptitud tienen una mayor pro- El enfoque AM/CE se ejemplifica con la identifica-
babilidad de persistir y dejar descendencia. Después de ción y control de un péndulo invertido completamente
varias generaciones, los mejores individuos se encuentran actuado (FAIP, por las siglas en inglés de Fully-Actuated
en la población y se puede seleccionar el más apto como Inverted Pendulum ) para el seguimiento preciso de tra-
la solución al problema. yectorias. Para esto, se adopta la metodología CRISP-
DM, cuyas fases se detallan mejor a continuación.
Comprensión del negocio: En este caso de estudio,
el negocio gira alrededor del FAIP. Entonces, es necesa-
rio comprender las características de este sistema y los
objetivos que se pretenden alcanzar con él.
Para este ejemplo, se utiliza un FAIP similar al de la
Figura 4, el cual, tiene dos cuerpos rígidos, estos son, un
carro que realiza el movimiento horizontal (usando un
motor acoplado a un sistema de bandas), y un péndulo,
ubicado encima del carro, que puede rotar (utilizando
otro motor). El comportamiento del FAIP se puede des-
cribir completamente con cuatro variables que incluyen
la posición horizontal del carro y velocidad con la que
se desplaza, y la posición angular del péndulo y su ve-
locidad de giro. Asimismo, las posiciones del carro y el
péndulo se pueden medir por medio de codificadores ro-
tativos unidos a los motores, y sus velocidades se pueden
calcular mediante algún método de derivación numéri-
ca. Con respecto al efector, usualmente coincide con el
extremo del péndulo y la tarea que se propone realizar
con el FAIP en el ejemplo, es la del seguimiento de una
trayectoria sinusoidal que se mostrará más adelante.

Figura 3. Evolución natural de las jirafas según el Neodar-


winismo.
Dado que la identificación y control de sistemas pue-
den llegar a ser tareas muy complejas, el uso de un
enfoque de aprendizaje de máquina basado en cómputo
evolutivo (en adelante AM/CE) puede resultar efectivo
para llevarlas a cabo de la mejor manera.
Figura 4. Ejemplo de un péndulo invertido real.
Uso del enfoque AM/CE para la identifi-
cación y control de sistemas Comprensión de los datos: Esta fase implica un
Entre los distintos SD que existen, el péndulo invertido análisis de la información disponible para realizar la iden-
es un sistema mecánico capaz de realizar dos tipos de mo- tificación del FAIP. Con lo anterior se determinan las va-
vimientos: dependientes (en el caso subactuado, cuando riables que componen a los conjuntos de características
un movimiento depende del otro) o independientes (en el y etiquetas.
caso completamente actuado, donde cada movimiento se En cualquier instante, el comportamiento de los SD
gobierna por separado). Este sistema ha ganado popula- puede describirse mediante un conjunto reducido de va-
ridad debido a que tiene un comportamiento no lineal, es riables llamadas variables de estado, junto con un con-
relativamente simple, puede utilizarse para llevar a cabo junto de variables adicionales de entrada o control. En
experimentos variados en el área de control y se incluye sistemas como el FAIP, los estados normalmente inclu-
en aplicaciones como robots bípedos, plataformas de des- yen las coordenadas generalizadas (las posiciones del ca-
pegue espacial o sistemas de estabilización de edificios en rro y el péndulo) y sus primeras derivadas con respecto
caso de sismos, entre otras [8]. al tiempo (las velocidades del carro y el péndulo).

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 45 / 88
Por lo tanto, en un instante cualquiera, el FAIP tie- y la línea punteada muestra la energía que se inyecta a
ne un estado determinado. Si una acción de control se cada actuador.
aplica en ese momento a sus actuadores, el estado del Modelado: Durante esta fase, se establece una es-
FAIP será distinto dentro de un breve periodo de tiem- tructura de modelo adecuada para describir el compor-
po futuro (conocido como periodo de muestreo). De esta tamiento del sistema y sus parámetros se ajustan utili-
forma, el conjunto de características del sistema puede zando los datos del subconjunto de entrenamiento. Para
estar conformado por el estado del sistema y el valor de este sistema, el modelo se deriva utilizando las leyes de
las acciones de control. Estos últimos se aplican en dis- Newton y tiene una estructura matemática como la que
tintos instantes de tiempo. Adicionalmente, el conjunto se observa en la Figura 6.
de etiquetas puede contener el estado futuro al que el
sistema llega después de un periodo de muestreo a partir
de esos valores.
Preparación de los datos: En este punto, las varia-
bles de los conjuntos de características y etiquetas están
definidas. En esta fase es necesario extraer experimen-
talmente los valores de estas variables desde el sistema
real. Para sistemas mecatrónicos como el FAIP, es nece-
sario inducir el mayor número de movimientos distintos
en el sistema, de tal forma que se obtenga información
representativa acerca de su comportamiento. Esto se lo-
gra utilizando una señal de control estratégica que ex-
cite la dinámica del sistema (por ejemplo, una función
sinusoidal amortiguada) durante una ventana de tiempo
predefinida (cuanto más grande sea la ventana, mayor
será la información generada). Figura 6. Modelo del FAIP.
Debido a que el modelo de la Figura 6 posee una
estructura no lineal, el ajuste de sus parámetros es una
tarea compleja, pero puede realizarse con técnicas de CE.
8

Entre las técnicas de CE que existen actualmente, Evo-


6

4
lución Diferencial (ED) es una alternativa de gran po-
2
pularidad por su simplicidad y efectividad en la solución
0
de problemas de ingeniería [9]. Por esto, ED se usa en
-2
esta fase para encontrar los parámetros del modelo en la
-4 Figura 6.
-6 De esta forma, ED prueba distintas combinaciones
de parámetros del modelo, inicialmente aleatorias, y las
0 1 2 3 4 5 6 7 8 9 10

refina al paso de las generaciones a través de operaciones


como mutación, recombinación y selección. La aptitud de
8

6
cada alternativa se mide con base en el nivel de similitud
4 que el modelo ajustado tiene con el FAIP real. Entonces,
2 la configuración de parámetros más apta es aquella cu-
yo modelo otorga las mismas salidas del sistema real al
inyectarse las mismas entradas.
0

-2
Las metaheurísticas como ED son técnicas compu-
-4 tacionales estocásticas. Debido a esta aleatoriedad, los
resultados que se obtienen con ED son distintos en cada
0 1 2 3 4 5 6 7 8 9 10

ejecución. Por ello, se necesitan alrededor de treinta eje-


Figura 5. Datos de entrada y salida adquiridos desde el cuciones independientes de ED para obtener suficientes
péndulo invertido. alternativas de los parámetros del modelo.
Evaluación: Esta fase toma las treinta alternativas
La Figura 5 muestra la forma que tienen los datos de parámetros, obtenidas en el modelado, para verifi-
adquiridos desde el carro (gráfica de arriba) y el péndulo car su calidad con base en la información que no fue
(gráfica de abajo) del FAIP. La línea continua indica las contemplada durante su ajuste, es decir, los datos del
posiciones, la línea segmentada denota las velocidades, subconjunto de evaluación. Así, es posible determinar la

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 46 / 88
capacidad de cada configuración del modelo para gene- Una vez que se encuentra la mejor configuración del
ralizar el comportamiento del FAIP real en presencia de controlador, esta se puede implementar en el sistema real
entradas desconocidas. para verificar su comportamiento. La Figura 8 muestra la
La calidad de cada una de las treinta configuraciones respuesta del carro (gráfica de arriba) y el péndulo (grá-
del modelo se mide como la aptitud utilizada durante fica de abajo) del FAIP real que utiliza el controlador
el modelado considerando las características y etiquetas PID ajustado en la fase de despliegue. En esta figura, la
del subconjunto de evaluación. De esta manera, la mejor línea continua muestra la posición de cada elemento del
configuración del modelo será la que, usando las mismas FAIP a lo largo del tiempo, y la línea segmentada indica
entradas del sistema, es capaz de calcular salidas simila- la referencia o el valor deseado de estas posiciones. Como
res a las de este último. puede apreciarse, el FAIP desarrolla una trayectoria muy
Tras esta evaluación de calidad, la mejor alternativa cercana a la deseada. Lo anterior muestra la efectividad
de modelo se puede utilizar en la fase de despliegue. del AM/CE en la identificación y control de un sistema
Despliegue: Hasta este punto, ya se cuenta con el dinámico como el FAIP.
mejor modelo del FAIP y, en esta fase, puede utilizarse
como soporte en la toma de decisiones para alcanzar los
objetivos del negocio. Para el FAIP, el objetivo del nego- 1 AM/CE/ED Referencia

cio consiste en el seguimiento preciso de una trayectoria, 0.5

por lo que el modelo puede utilizarse en el diseño o ajuste


de una adecuada estrategia de control que lo logre. 0

Las estrategias de control que existen en la actualidad -0.5

son muy diversas. No obstante, el controlador Proporcio-


nal Integral Derivativo (PID) es, por mucho, la estrategia -1

de control más utilizada en la industria y por ello se eli- 0 1 2 3 4 5 6 7 8 9 10

ge para gobernar el comportamiento del FAIP como se


muestra en la Figura 7. 3 AM/CE/ED Referencia

-1

-2

-3

0 1 2 3 4 5 6 7 8 9 10

Figura 8. Seguimiento de una trayectoria sinusoidal usando


el controlador PID sintonizado con el enfoque AM/CE.
Conclusiones
Las tareas de identificación y control de SD son cruciales
para el desarrollo de aplicaciones que cubran las necesi-
Figura 7. Estrategia de control para el FAIP. dades de la sociedad actual. Sin embargo, estas dos tareas
son bastante complejas y requieren un gran esfuerzo para
Sin importar su tipo, todas las estrategias de con- ser abordadas adecuadamente.
trol incluyen parámetros susceptibles de sintonización Por fortuna, estas tareas se pueden alinear con meto-
que condicionan su rendimiento en la realización de una dologías de AM, como CRISP-DM, que pueden ayudar a
tarea. En el controlador PID, estos parámetros son las desarrollarlas de forma sistemática y simple, incremen-
ganancias proporcionales, integrales y derivativas. tando las posibilidades de alcanzar sus objetivos con éxi-
Una estrategia mal sintonizada, puede producir com- to. Además, pueden aprovechar la efectividad de técnicas
portamientos no deseados en el sistema controlado y pro- de CE para resolver los problemas complejos involucra-
vocar costos y daños. Afortunadamente, el modelo obte- dos en sus fases.
nido a partir de las fases anteriores se puede utilizar para Por lo anterior, un enfoque AM/CE, como el que se
predecir el comportamiento del sistema real. Lo anterior desarrolla en este trabajo para el FAIP, resulta adecuado
permite identificar la mejor configuración de los paráme- para identificar modelos precisos que pueden utilizarse
tros, sin el riesgo que implica realizar estas pruebas en el en el ajuste efectivo de estrategias de control.✵
sistema real.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 47 / 88
REFERENCIAS 6. Wirth, R. (2000). CRISP-DM: towards a standard process mo-
del for data mining. En Proceedings of the Fourth International
1. Ogata, K. y Yang, Y. (2002). Modern Control Engineering. Conference on the Practical Application of Knowledge Disco-
Cuarta edición, Prentice Hall, India. very and Data Mining, Manchester, GBR., 29–39.
2. Ljung, L. (1998). System Identification. En Procházka A., et al.
(Eds.) Signal Analysis and Prediction: Applied and Numerical 7. Bäck, T., Fogel, D.B., y Michalewicz, Z. (1997). Handbook
Harmonic Analysis. Birkhäuser, Boston, MA., 163-173. of evolutionary computation. Primera edición. IOP Publishing
3. Rodríguez-Molina, A., Mezura-Montes, E., Villarreal- Ltd., GBR.
Cervantes, M.G., y Aldape-Pérez, M. (2020). Multi-objective
meta-heuristic optimization in intelligent control: a survey on 8. Boubaker, O. (2012). The inverted pendulum: A fundamental
the controller tuning problem. Applied Soft Computing, 93 benchmark in control theory and robotics. En Proceedings of
1-26. International Conference on Education and e-Learning Inno-
4. Michalski, R S., Carbonell, G., y Mitchell, T.M. (2013). Machine vations, Susa, Túnez, 1-6.
learning: An artificial intelligence approach. Springer Science
and Business Media, Berlín, Alemania.
9. Storn, R. y Price, K. (1997). Differential Evolution – A Simple
5. Kitchin, J.R. (2018). Machine learning in catalysis. Nature Ca- and Efficient Heuristic for Global Optimization over Continuous
talysis, 1(4), 230–232. Spaces. Journal of Global Optimization, 11(4), 341–359.

SOBRE LOS AUTORES

Alejandro Rodríguez-Molina es Ingeniero en Sistemas Computacionales por la ESCOM-IPN, Maes-


tro en Ciencias de la Computación por el CINVESTAV-IPN y Doctor en Ingeniería de Sistemas Robó-
ticos y Mecatrónicos por el CIDETEC-IPN. Es profesor en el Tecnológico Nacional de México campus
Tlalnepantla y realiza investigación en Inteligencia Artificial aplicada a la solución de problemas en
ingeniería.
Miguel Gabriel Villarreal-Cervantes obtuvo el grado de Ingeniero en Electrónica en el Instituto
Tecnológico de Veracruz y el grado de Maestro y Doctor en Ciencias en Ingeniería Eléctrica opción
Mecatrónica en el CINVESTAV-IPN. Cuenta además con una especialidad de Técnico en Sistemas
Computacionales. Es profesor investigador en el Centro de Innovación y Desarrollo Tecnológico en
Cómputo del Instituto Politécnico Nacional (CIDETEC-IPN) en México. Su interés en investigación se
centra en la optimización de sistemas mecatrónicos, cómputo evolutivo aplicado en el diseño y control
de sistemas mecatrónicos, sintonización de controladores con enfoques evolutivos y robótica.

Miguel Ángel Paredes-Rueda es Ingeniero Electromecánico y Maestro en Ciencias en Ingeniería


Mecánica por el Tecnológico Nacional de México campus Tlalnepantla (TecNM-ITTLA). Actualmente,
es profesor, investigador y jefe de la División de Estudios de Posgrado e Investigación del TecNM-
ITTLA. Sus intereses de investigación se centran en los sistemas electromecánicos.

Carlos Alberto Guerrero-León es Licenciado en Matemáticas por la Universidad Juárez Autónoma


de Tabasco y actualmente cursa la Maestría en Ciencias de la Ingeniería en el Tecnológico Nacional de
México campus Tlalnepantla. Sus intereses en investigación incluyen teoría de grafos, aprendizaje de
máquina y ciencia de datos.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 48 / 88
ARTÍCULO ACEPTADO
El aprendizaje de máquina y el modelado de
propiedades de materiales nanoestructurados
Kaled Corona-Romero, M. Fernanda Rosales-De la Cruz, Diego E. Navarro-López, Edgar R. López-
Mena y Gildardo Sánchez-Ante
Motivación demanda contínuamente la creación de nuevos materia-
Existe la preocupación en la comunidad de la salud pú- les con propiedades específicas. Desafortunadamente, el
blica ante el desarrollo de resistencia microbiana a los proceso de desarrollo y comercialización suele ser muy
fármacos. Esto significa esencialmente que algunas bac- largo y costoso. Ejemplo de ello son materiales como el
terias catalogadas como multirresistentes, han desarro- Teflón, el Velcro y el Policarbonato, algunos de los cua-
llado mecanismos que les permiten evadir los fármacos les requirieron hasta de 25 años para llegar a la etapa
tradicionales[1]. Es por ello que, entre otras acciones, se comercial [2]. Claramente, este es un reto que se busca
están tratando de encontrar nuevos materiales que ten- resolver [3]. En este trabajo se describirá brevemente có-
gan propiedades antimicrobianas y que preferentemente mo el aprendizaje de máquina está siendo usado como
no permitan que las bacterias desarrollen resistencia a una herramienta para acelerar el proceso de diseño de
ellos. Éste es un claro ejemplo de cómo la vida moderna materiales antimicrobianos.

El diseño de nuevos materiales puede beneficiarse de técnicas


computacionales como el aprendizaje de máquina.
Diseño de nuevos materiales antimicro- ser un factor primordial para la utilización de técnicas
bianos computacionales que apoyen al proceso inductivo.
Diseñar un nuevo material es complicado, entre otras co-
sas, porque el desempeño final de ese material es determi-
nado por varias características interrelacionadas. Existen
básicamente dos enfoques para el proceso: el enfoque in-
ductivo y el enfoque deductivo. Ambos contemplan fun-
damentalmente los mismos elementos, solo que en un
orden diferente. La Figura 1 muestra esos elementos e
indica el orden en que se consideran en cada tipo de en-
foque. El enfoque que se usa con mayor frecuencia hoy
día es el deductivo (bottom-up). Hacer cambios en la sín-
tesis de un material tiene efectos en la microestructura
del mismo. Es decir, impacta la forma en que sus áto-
mos están colocados en el espacio. Esa microestructura,
por su parte, define las propiedades del material y por
ende su desempeño para alguna tarea. A diferencia de
cómo esos cambios y sus efectos van propagándose en
el enfoque deductivo, en el caso del enfoque inductivo
se parte de especificar las propiedades requeridas en el
material. Posteriormente, se calcula la microestructura
requerida y se define el proceso de síntesis. Diversos au-
tores consideran que este enfoque será cada vez más uti-
lizado, sobre todo, con la adición de nuevas herramientas Figura 1. Fases del diseño de un nuevo material y los dos
computacionales [3] [4]. Por cierto, aunque pocas veces enfoques para el flujo de trabajo.
se menciona de manera explícita, a la par de estas etapas
del proceso de diseño se llevan a cabo actividades de reco- La Organización Mundial de la Salud ha identificado
lección, almacenamiento, depuración e interpretación de al óxido de zinc (ZnO) como un compuesto que exhibe
datos experimentales. Se verá cómo esos datos pueden propiedades antimicrobianas. Con la finalidad de maxi-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 49 / 88
mizar la eficacia de ese material, se han desarrollado es- equipos especializados y evaluar la efectividad biológica
tudios en los que se insertan otros elementos químicos a para determinar el efecto antimicrobiano. Este proceso
la estructura del óxido de zinc. Normalmente, se trata de puede llevar en total varios meses, por lo que a la par
elementos que pertecen a la familia de las tierras raras, se buscan alternativas que permitan acelerarlo. Una de
o también conocidos como lantánidos. Varios de esos 15 ellas es la utilización de técnicas de aprendizaje de má-
elementos químicos están siendo estudiados o empleados quina.
para la industria de las energías renovables, la electró-
nica y la medicina. En este último caso, el desarrollo y El aprendizaje de máquina
aplicación de nuevos materiales nanoestructurados como En años recientes uno de los términos que aparecen con
agentes antimicrobianos incluye, en términos generales, más frecuencia, no solo en textos de las ciencias compu-
las siguientes etapas: tacionales sino de otras áreas, es el del aprendizaje de
Síntesis del material: en esta etapa se construye máquina, o como se le conoce en inglés, el machine lear-
el nanomaterial a través de un proceso de síntesis ning (ML).
química. La razón de esta explosión en el uso del término y
lo que conlleva, tiene que ver en buena medida con su
Estudio de la estructura del material: se analiza a utilidad como herramienta para la resolución de proble-
detalle la estructura cristalina del material, es de- mas complejos en una variedad interesante de ámbitos.
cir, la manera en que sus átomos se colocan en el Algunos de los ejemplos clásicos de este tipo de proble-
espacio tridimensional. Para ello se requiere aplicar mas son: determinar si un correo electrónico en particular
diversas técnicas de la química analítica. es correo no deseado (spam), reconocer caras de perso-
nas, traducir entre diferentes idiomas, poder reconocer
Determinación de propiedades: se hacen pruebas voces y hacer que un robot se mueva adecuadamente. A
preliminares de los materiales como agentes anti- esos ejemplos, ya de libros de texto, se suman otros más
microbianos. Se obtienen datos como efectividad, novedosos y/o mas especializados, como la clasificación
concentraciones mínimas de material a usar y tiem- de imágenes médicas, la interpretación de resultados ex-
po de exposición, entre otros. perimentales y la conducción de vehículos autónomos,
Análisis de desempeño: se realizan pruebas para por mencionar algunos. Todos esos problemas tienen en
determinar la cinética del mecanismo de reacción común que diseñar los programas o algoritmos para re-
de los materiales y las bacterias. Se relacionan las solverlos suele ser sumamente complicado. Pensemos por
características morfológicas y estructurales con el un momento que se desea escribir un programa para que
poder antimicrobiano de los materiales. Se com- un vehículo autónomo sea capaz de ir de un sitio a otro
paran esos resultados con otros nanomateriales ya en la ciudad. Son tantas las condiciones que hay que
reportados. vigilar que es una tarea titánica. Sin embargo, otro fac-
tor común en esos mismos problemas es que los huma-
En trabajos reportados con anterioridad [5][6], se ha nos suelen resolverlos observando ejemplos de solución y
analizado el efecto de las sustituciones atómicas en el óxi- aprendiendo de ellos.
do de zinc. En particular, se han reemplazado átomos de Es aquí donde el aprendizaje de máquina o apren-
zinc por elementos como el erbio y el iterbio. Ese reem- dizaje automático hace su aparición. Si en esos casos
plazo modifica parámetros importantes de la estructura es posible obtener datos que funcionen como ejemplos,
y forma (morfología) del material nanoestructurado, lo entonces con las técnicas adecuadas del aprendizaje de
que conlleva a una modificación en sus propiedades físi- máquina, se puede lograr que la computadora aprenda
coquímicas. Esto es relevante para el caso de materiales a resolverlos. Por poner un ejemplo simple, se podrían
antimicrobianos ya que bacterias como la Escherichia recolectar N imágenes de la cara de una persona, con
coli y el Staphylococcus aureus son sensibles al tamaño algunas variaciones en su perspectiva, iluminación y es-
de partícula y a la dosis del material. El estudio de la cala, y con ellas se buscaría entrenar a un sistema para
cinética de reacción de esas bacterias con esos nuevos que reconozca a esa persona en una nueva imagen. Esa
nanomateriales ha mostrado una efectividad de hasta es una tarea típica de la que se encarga el aprendizaje de
el 92 % en la inhibición del crecimiento de las bacterias. máquina.
Este resultado permite considerar a estos nanomateriales El aprendizaje de máquina es una rama de la inte-
como potencialmente aplicables para la industria médica ligencia artificial cuyo objetivo es lograr que la compu-
y biotecnológica. Sin embargo, se requiere el desarrollo tadora pueda aprender automáticamente a partir de da-
de una gran cantidad de experimentos en el laboratorio tos. La idea general es recolectar datos del problema en
para sintetizar materiales con variaciones en ciertos pa- cuestión, y usar esos datos para aprender cómo es que
rámetros. Cada que se sintetiza una nueva versión del se resuelve la tarea. Este tipo de enfoque tiene venta-
material, es necesario caracterizarlo mediante diversos jas tales como: a) resolver tareas de un cierto nivel de

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 50 / 88
complejidad de manera robusta, b) que las soluciones se tan buena o mala es una cierta salida. A esa medición
construyen con base a datos, más que solamente en la se le suele llamar recompensa, que por cierto puede ser
intuición y c) que es relativamente fácil adaptarse a nue- positiva o negativa. En términos simples, en este caso de
vas situaciones mediante la incorporación de más datos. aprendizaje se suele dar un ciclo en el que un agente per-
El principio subyacente en la teoría del aprendizaje au- cibe su entorno, decide por una acción (o secuencia de
tomático es que prácticamente todos los problemas que acciones) y obtiene como consecuencia una recompensa.
involucran aprendizaje pueden ser formulados como co- El ciclo se repite y el agente incorpora la información de
rrespondencias entre entradas y salidas, aunque en mu- las recompensas para modificar la forma en la que decide
chas ocasiones esa correspondencia sea compleja. Esta las acciones a ejecutar.
noción se muestra en la Figura 2. Después de esta breve introducción al aprendizaje de
máquina y sus clases, en lo que resta de este artículo se
describirá una aplicación orientada a acelerar el proceso
de desarrollo de un nuevo material nanoestructurado con
implicaciones en la biotecnología.
El aprendizaje de máquina y el diseño de
nuevos materiales
En los últimos años, la participación de las ciencias
computacionales en la ciencia de los materiales ha ido
cambiando desde el uso de herramientas para el desarro-
llo de cálculos complejos y simulaciones, hasta su apli-
cación en el diseño de nuevos materiales, empleando la
Figura 2. Diferencias entre la programación tradicional y el minería de datos y el aprendizaje automático. A últi-
aprendizaje de máquina. mas fechas se están dedicando grandes esfuerzos a la im-
plementación de modelos más adecuados que combinen
métodos experimentales con técnicas basadas en la inte-
En términos simples, se consideran tres tipos de ligencia artificial.
aprendizaje [7]: Las aplicaciones del aprendizaje automático en el des-
Aprendizaje supervisado: En este tipo de aprendi- cubrimiento y diseño de materiales se pueden dividir en
zaje se requieren datos de la forma (i, o), donde i son las tres clases principales: predicción de propiedades de ma-
entradas y o las salidas correspondientes a esas entradas. teriales, descubrimiento de nuevos materiales y otros pro-
Con dicha información es posible entrenar un modelo. pósitos.
Algunos algoritmos de este tipo son las redes neurona- Por lo que respecta a la predicción de propiedades
les artificiales (RNA), las máquinas de soporte vectorial de los materiales, normalmente se utilizan métodos de
(SVM) y los árboles de clasificación, entre muchos otros. análisis de regresión. Un escenario típico, en ese caso,
En el caso en que las respuestas sean números reales, se es como el siguiente: se dispone de datos experimentales
dice que se trata de un problema de regresión. Si las res- que se han recabado en el laboratorio, con esos datos se
puestas son etiquetas con valores específicos, se dice que entrena un modelo de aprendizaje y el modelo es utili-
se trata de un problema de clasificación. zado para identificar nuevos experimentos promisorios o
Aprendizaje no supervisado: En ocasiones no se incluso para extrapolar algunos análisis a nuevos mate-
tiene acceso a las respuestas, sino que solamente se cuen- riales. La Figura 3 ilustra dicho escenario.
ta con las entradas. En estos casos, el problema se formu- A la fecha, se cuenta con datos de cerca de 700 expe-
la como encontrar los patrones subyacentes en los datos. rimentos, que incluyen nanomateriales basados en ZnO
Esos patrones por ejemplo dirían si existen correlaciones combinado con erbio, iterbio, samario y cerio. Con los
entre los datos o si los datos pueden agruparse de alguna datos de esos experimentos, se probaron varios métodos
manera, considerando que se comportan de manera simi- del aprendizaje supervisado, tales como regresión lineal,
lar entre ellos. Estas técnicas útiles para entender mejor máquinas de vector soporte y perceptrón multicapa. En
los datos y para detectar valores anómalos. Dentro de virtud de que el perceptrón multicapa (MLP) ofreció una
esta clase de aprendizaje se encuentran diversos algorit- mayor precisión, se seleccionó ese modelo.
mos de agrupamiento (clustering), como el de K -medias Los modelos generados han reportado errores entre el
(K -means). 2 y el 4 % por lo que se pueden considerar como acepta-
Aprendizaje por refuerzo. En este caso, no se tie- bles. La red MLP considera como entradas los siguientes
ne acceso directo a la respuesta correcta para una cierta atributos: parámetros de celda (a y c), tiempo de expo-
entrada, sino que se puede obtener una medida de que sición al material, elemento químico adicionado al óxido

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 51 / 88
de zinc, concentración de ese elemento, tamaño del cris- Mediante el uso de datos, en este caso propios, se han
tal y tipo de bacteria. La propiedad que se mide como creado modelos basados en el aprendizaje supervisado,
resultado es la absorbancia en una muestra del cultivo de concretamente en redes neuronales perceptrón multica-
la bacteria, que es una forma indirecta de medir el efec- pa, con los cuales se puede ayudar en la optimización de
to antimicrobiano del material. Contar con un modelo la etapa experimental en el laboratorio.
como este permitiría, entre otras tareas, que dado un di- Sin duda, las herramientas que la inteligencia artifi-
seño de experimentos, se prioricen aquellos que pudieran cial, y especialmente el aprendizaje de máquina tienen
resultar más promisorios. Hipotéticamente con ello se po- son una alternativa viable y eficiente para un desarollo
dría reducir el número de experimentos ejecutados en el mas sostenible de materiales nuevos.✵
laboratorio sin afectar de manera importante la calidad
de la información recabada. Este enfoque pudiera incluso
extenderse para elementos químicos de los cuales aun no REFERENCIAS
se han hecho pruebas, lo que sería ya una extrapolación 1. González, J., Maguiña, C., González, F. (2019). La resistencia a
del modelo. Esta última tarea aun está pendiente de ser los antibióticos: un problema muy serio. Acta Médica Peruana,
36(2), 145-151.
validada.
2. Eagar, T. (1995). Bringing new materials to market.
T echnology Review, 98(2), 42-49.
3. Stein, H., y Gregoire, J.M. (2019). Progress and prospects for
accelerating materials science with automated and autonomous
workflows. C hemical science, 10(42), 9640-9649.
4. Muchnick, H., Thompson, S., Samadiani, E., Allen, J., Joshi,
Y., y Mistree, F. (2006). Exploring the Advantages of Materials
Design in a Product Design Process. En P roc ASME 2006 Inter-
Figura 3. El proceso de diseño del nanomaterial antimicro- national Design Engineering Technical Conferences and Compu-
biano con redes neuronales. ters and Information in Engineering Conference, 529-543.
5. Sánchez-López, A., Perfecto-Avalos, Y., Sanchez-Martinez, A.,
Ceballos-Sanchez, O., Sepulveda-Villegas, M., Rincón-Enríquez,
Conclusiones G., Rodríguez-González, V., Garcia-Varela, R. Marcelo, L.,
Navarro-López, D, Sanchez-Ante, G., Corona-Romero, K., y
El diseño de nuevos materiales es una necesidad creciente López-Mena, E., (2022). Influence of erbium doping on zinc oxi-
de nanoparticles: Structural, optical and antimicrobial activity,
en la industria, pero el proceso que actualmente se usa Applied Surface Science, 575(151764).
es básicamente de prueba y error, lo que implica la utili- 6. Navarro-López, D., Garcia-Varela, R., Ceballos-Sanchez, O.,
zación de una gran cantidad de recursos. En paralelo, la Sanchez-Martinez, A., Sanchez-Ante, G., Corona-Romero, K.,
tendencia de compartir datos y la existencia incluso de Buentello-Montoya, D.A., Elías-Zuñiga, A., y López-Mena, E.,
(2021). Effective antimicrobial activity of ZnO and Yb-doped
proyectos financiados por agencias gubernamentales pa- ZnO nanoparticles against Staphylococcus aureus and Escheri-
ra recolectar y compartir los datos ha permitido que hoy chia coli, M aterials Science and Engineering: C, 23(112004).
dia existan diversas bases de datos conteniendo medicio- 7. Svensén, M., y Bishop, C. M. (2007). Pattern Recognition and
nes de propiedades de muchos materiales disponibles. Machine Learning, New York, Springer.

SOBRE LOS AUTORES

Kaled Corona-Romero cursa la Ingeniería en Ciencia de datos y Matemáticas en el Tecnológico de


Monterrey. Es miembro de la Association for Computer Machinery (ACM) desde 2021. Actualmente
es asistente de investigación en el grupo de investigación Nanobiotecnología. Sus áreas de interés son
el aprendizaje de máquina, las tecnologías que mejoran la privacidad y la criptografía.

M. Fernanda Rosales-De la Cruz estudia Ingeniería en Biotecnología en el Tecnológico de Mon-


terrey desde 2018. Actualmente es asistente de investigación en los grupos de Nanobiotecnología y
FoodBiotech. Entre sus intereses de investigación destacan el estudio de los efectos de nanopartículas
en sistemas biológicos y la creación de alimentos funcionales a partir de subproductos industriales.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 52 / 88

Diego E. Navarro-López es doctor en ciencia y tecnología en biotecnología productiva por el Centro


de Investigación Asistencia en Tecnología y Diseño del Estado de Jalisco (2018). Actualmente es profesor
en el Tecnológico de Monterrey. Sus áreas de interés son el estudio de nanomateriales como agentes
antimicrobianos y el desarrollo de nuevas tecnologías para la modificación del metabolismo secundario
en plantas. Es miembro del Sistema Nacional de Investigadores, Nivel I.

Edgar R. López-Mena obtuvo el grado de doctor en Ciencias en Física. Fue investigador visitante
en Nanyang Technological University, Singapur (2017-2018). Actualmente es profesor investigador en el
Tecnológico de Monterrey, sus líneas de investigación son la nanobiotecnología, nanomedicina y energías
renovables. Es miembro del Sistema Nacional de Investigadores, Nivel I.

Gildardo Sánchez Ante es doctor en Ciencias Computacionales por el Tecnológico de Monterrey


(2002). Fue investigador invitado en el Laboratorio de Robótica de la Universidad de Stanford (1999-
2001) y en la Universidad Nacional de Singapur (2004-2005). Actualmente es profesor investigador en
el Tecnológico de Monterrey. Sus áreas de interés son el aprendizaje de máquina, la IA y la planeación
de movimientos en robots. Es miembro del Sistema Nacional de Investigadores, Nivel I.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 53 / 88
ARTÍCULO ACEPTADO
Redes Adversarias Generativas: engañando a la
inteligencia humana
Leonardo Herrera, Marlen Meza-Sánchez, M.C. Rodríguez-Liñán y Eddie Clemente
¿Qué son las Redes Adversarias Genera- de billetes, y por otro lado un policía que le sigue la pista
tivas? a través de verificar los billetes que el delincuente dispen-
Las Redes Adversarias Generativas (RAG) son una ar- sa. En principio, el delincuente no tiene mucha experien-
quitectura de la Inteligencia Artificial (IA), particular- cia en fabricar billetes falsos, mientras que el policía sí la
mente del Aprendizaje Profundo (AP), que consiste en tiene en detectarlos, ya que conoce la descripción de las
dos Redes Neuronales Convolucionales (RNC), denomi- características que debe tener un billete verdadero. Esto
nadas Generador y Discriminador, las cuales se entrenan significa que, al inicio, el Discriminador de las RAG tiene
para resolver de forma óptima una tarea. Las RNC son la capacidad de distinguir entre las imágenes reales y las
una clase particular de redes neuronales propuestas para que produce el Generador. En la analogía, se deduce que
realizar operaciones en tareas de visión por computadora la inexperiencia del delincuente debe llevar a su pronta
y que han evolucionado para abordar un sinfín de pro- captura; sin embargo, el delincuente se supera y produ-
blemas de la ingeniería. En su versión más simple, las ce billetes falsos más parecidos a los reales, entonces la
redes neuronales son un conjunto de nodos -usualmente tarea para el policía ya no es tan simple. El policía aho-
llamados neuronas- que se interconectan entre sí a tra- ra necesita entrenarse para reconocer los nuevos billetes
vés de pesos. Estas redes se entrenan con datos, con la falsos producidos por el delincuente. Una vez entrenado,
finalidad de modelar fenómenos que resultan difíciles de es capaz de nuevamente detectar billetes falsos. El de-
ser modelados por leyes establecidas (leyes de Newton, lincuente no se queda atrás, y se supera en crear billetes
por ejemplo). En el proceso de entrenamiento, los pará- falsos, y llega a un punto de perfección en donde, por más
metros de la red (pesos) son ajustados de tal forma que que el policía se entrene, no hay forma de que los bille-
la red alcance un modelo confiable. tes producidos por el delincuente puedan ser detectados
como falsos. Finalmente, el delincuente se ha salido con
La arquitectura de las RAG fue presentada por pri- la suya, la distribución de probabilidad de sus billetes
mera vez en 2014 [1], y su prominencia se puede apre- falsos es igual a la de los billetes reales, y el policía a lo
ciar en las casi 40,000 citas que ha ganado a la fecha de más que llega es a tener la certidumbre de 50 % sobre la
enero 2022, además del sinnúmero de aplicaciones que falsedad de los billetes. Esto significa que el policía tiene
esta arquitectura permite en diversos campos de la inge- la misma probabilidad de equivocarse que de acertar al
niería, como explicaremos más adelante. Su fase de en- clasificar un billete falso y uno real.
trenamiento es a través de la técnica de Aprendizaje No La analogía policía-delincuente ejemplifica el proceso
Supervisado (ANS). Esto significa que las RAG utilizan de entrenamiento de las RAG. Una vez que este entre-
sólo datos sin etiqueta, esto es, imágenes que no están namiento concluye de forma óptima, las RAG pueden
clasificadas. Durante el proceso de entrenamiento, am- generar imágenes falsas similares a las imágenes reales.
bas redes “compiten” constantemente con la intención de Las imágenes generadas no son necesariamente las mis-
ser mejor que la otra. El Generador buscará engañar al mas que las reales empleadas en el entrenamiento, pero
Discriminador creando imágenes a través de la búsqueda son similares en el sentido de que en ambas aparecen las
e imitación de patrones encontrados en imágenes reales. mismas características de identificación (esto es, que las
Su objetivo es generar imágenes falsas que el Discrimi- imágenes generadas y las reales provienen de una misma
nador sea incapaz de distinguir entre ellas y las imágenes distribución de probabilidad).
reales. Por otro lado, el Discriminador buscará ganarle al Cabe mencionar que la distribución de probabilidad
Generador distinguiendo correctamente entre las imáge- en el contexto de imágenes resulta un concepto abstracto.
nes falsas y las reales. Un óptimo entrenamiento concluye Sin embargo, mantiene la esencia que en el caso de una
con la victoria del Generador, donde este produce imá- sola variable. Dicho esto, la distribución de probabilidad
genes falsas similares a las reales y el Discriminador es de un conjunto de imágenes es una función que asigna a
incapaz de distinguirlas de las reales. cada imagen la probabilidad de que dicha imagen ocu-
El proceso de entrenamiento de las RAG puede expli- rra. Podemos decir, que un conjunto de imágenes es un
carse a través de la analogía policía-delincuente, donde el conjunto de matrices que a su vez puede transformarse
policía juega el papel del Discriminador y el delincuente a un conjunto de vectores. Por ejemplo, una imagen de
el del Generador. Imaginemos un delincuente falsificador n×n píxeles, es una matriz de n×n elementos, que a su

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 54 / 88
vez es un vector de (n×n)×1 elementos. Al tratar con
imágenes tratamos con vectores, y al tratar con vectores
podemos definir distribuciones de probabilidad multidi-
mensionales para dado conjunto de vectores.
Al finalizar de forma óptima el entrenamiento de las
RAG, el Discriminador solo puede acertar el 50 % de las
veces en identificar una imágen falsa de una real, por lo Figura 2. Evolución del Generador y del Discriminador du-
que su salida toma un valor de 0.5. Llegada esta etapa rante un entrenamiento óptimo [1].
del entrenamiento, se dice que la arquitectura finalmente
ha alcanzado el equilibrio de Nash, el cual es un concepto
de la Teoría de Juegos que garantiza un resultado óptimo
La Matemática detrás de las RAG
Con fines ilustrativos, el estudio matemático presenta-
[2,3]. do en esta sección se confina al contexto unidimensional,
De acuerdo a la arquitectura mostrada en la Figura 1, donde las distribuciones de probabilidad son funciones
el Discriminador (D) es entrenado para una tarea de cla- escalares. El planteamiento de las RAG se basa en que
sificación binaria; es decir, el resultado en su salida toma tanto el Discriminador como el Generador optimicen una
dos posibles valores, ya sea que clasifique las imágenes función matemática. En el trabajo original [1], se propo-
como reales (con valor numérico de 1) o como imágenes ne el uso de funciones logarítmicas para construir esta
falsas (con valor numérico de 0) que han sido producidas función. Este proceso se describe a continuación.
por el Generador. A su vez, el Generador (G) es entrena- Primero, considere la función
do para engañar al Discriminador a través de imágenes
falsas (G(Z)), generadas a partir de ruido aleatorio (Z) f(D) = a log(D), (1)
en su entrada.
Imágenes la cual se muestra en la Figura 3 para un valor de a = 1.
reales

Discriminador 0
(D)
-1

Generador (G) Máximo en D=1


Imágenes falsas (G(Z)) -2

-3
Ruido (Z)

Figura 1. Arquitectura de las RAG. -4

La Figura 2, de izquierda a derecha, muestra la evo- -5


lución de un entrenamiento óptimo para las RAG: en 0 0.2 0.4 0.6 0.8 1
color negro la distribución de probabilidad de las imáge-
nes reales; en verde la distribución de probabilidad de las
imágenes falsas; y en azul la salida del Discriminador. Al Figura 3. Función costo f(D) = log(D) para el Discrimina-
inicio del entrenamiento (izquierda), se puede observar dor.
que la distribución de las imagénes falsas es distinta a
la de las imágenes reales, y la salida del Discriminador El Discriminador es entrenado para que la función
no es constante. Conforme el entrenamiento avanza (cen- (2) alcance su valor máximo, siempre y cuando las imá-
tro), se puede observar que la distribución de imágenes genes que reciba sean reales. Cuando el Discriminador
falsas se empieza a parecer a la de las imágenes reales logra que esta función de costo alcance el valor máximo,
y que, al mismo tiempo, la salida del Discriminador co- el cual es 0, este alcanza el valor de 1. Esto significa que
mienza a adquirir un valor constante. Finalmente, en el el Discriminador es capaz de clasificar correctamente las
lado derecho, se aprecia que la distribución de imágenes imágenes reales.
falsas ahora es igual a la de imágenes reales; la salida del Ahora considere la función
Discriminador es una constante de valor 0.5 ya que el
entrenamiento ha llegado a su óptimo, y el Discrimina- f(D,G) = b log(1-D(G(Z))), (2)
dor ya no es capaz de diferenciar entre imágenes reales o
falsas. la cual se muestra en la Figura 4 para un valor de b = 1.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 55 / 88
de una función son aquellos en donde su derivada es igual
0
a cero. Entonces, derivando la función f con respecto a
el Discriminador, se obtiene
-1

∂ [a log(D) + b log(D(G(Z)) − 1)] a b


-2
Máximo en D=0
∂D
= −
b 1−D
. (4)

-3
Igualando a cero el valor obtenido,
a b
b

1−D
= 0. (5)
-4
Finalmente, se encuentra el valor óptimo del Discrimina-
-5 dor, despejando D de la ecuación (5), esto es
0 0.2 0.4 0.6 0.8 1
a
D= a+ b
, (6)
Figura 4. Función costo f(D, G) = log(1-D(G(Z))) para el el cual es un máximo global, es decir, el valor de D donde
Discriminador y Generador. se obtiene el valor más alto de toda la función de costo
f.
Como puede observarse, es una función que se evalúa
utilizando ambos, Discriminador y Generador. El valor
de D(G(Z)) se refiere a la salida del Discriminador cuan-
do recibe imágenes falsas, y se muestra como D en la Fi-
gura 4. El Generador se entrena para minimizarla, lograr -1

que D sea igual a uno, lo cual significa engañar al Dis-


criminador para que clasifique las imágenes falsas como -2
reales. Por otra parte, el Discriminador es entrenado pa- Máximo en D=0.357
ra maximizarla. En este caso, el Discriminador adquiere
el valor de 0, lo que implica que puede clasificar correc- -3
tamente las imágenes falsas producidas por el Generador
y no dejarse engañar por él.
Finalmente, la función de costo para el proceso de -4
entrenamiento de ambas redes se define como una suma
de las funciones anteriores, esto es 0 0.2 0.4 0.6 0.8 1

f = a log(D) + b log(1-D(G(Z))), (3)


Figura 5. Función de costo f = a log(D) + b log(1-D(G(Z)))
donde a y b, no son valores arbitrarios, sino que corres- que representa la suma de funciones f(D) y f(D, G) para el
ponden a las distribuciones de probabilidad de las imáge- caso particular de a =0.5 y b =0.9.
nes reales y falsas, respectivamente. Aquí la “competen-
cia” se da entre ambas RNC, Discriminador y Generador, Para el ejemplo particular de la función de costo con
durante la etapa de entrenamiento. Así que ambas usa- valores a =0.5 y b =0.9, el valor óptimo del Discrimi-
rán la función de costo f descrita por la ecuación (3), pe- nador que la maximiza se encuentra sustituyendo dichos
ro el Generador buscará minimizarla y el Discriminador valores en la ecuación (6). Esto es, D = 0.50.5
+0.9 =0.357, el
maximizarla. Para engañar al Discriminador, el Genera- cual corresponde al valor máximo señalado en la gráfica
dor debe producir imágenes falsas que el Discriminador de la Figura 5.
clasifique como reales. El objetivo del Discriminador es El procedimiento para calcular el valor óptimo del
no dejarse engañar y clasificar correctamente cuando las Generador que minimiza la función de costo f sigue la
imágenes son falsas o reales. misma esencia que el razonamiento anterior. Dado el Dis-
La Figura 5 muestra la gráfica de la función costo f criminador óptimo, el Generador óptimo sucede cuando
usando valores de a =0.5 y b =0.9, donde la forma de la la distribución de probabilidad de las imágenes falsas es
función f no permite distinguir a simple vista dónde se igual a la de las imágenes reales, es decir, cuando a = b.
alcanza el valor máximo que define al óptimo para el Dis- Por lo tanto, considerando ambas distribuciones iguales,
criminador. Para ello, se aplica el criterio de la primera el valor óptimo (6) para el Discriminador es
derivada de la función con respecto al Discriminador. Es-
te criterio establece que los valores máximos y mínimos D = a +a a = 0.5. (7)

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 56 / 88
La Figura 6 muestra que el valor óptimo para el Dis- rostros realistas de personas inexistentes a partir de imá-
criminador siempre es 0.5 cuando ambas distribuciones genes de rostros de personas reales. StyleGAN [4], una
son iguales (esto es, cuando a = b). Este resultado es versión mejorada de las RAG, es una arquitectura que ha
intuitivo, ya que la distribución de probabilidad de las logrado generar dichos rostros que literalmente engañan
imágenes falsas es igual a la de las reales, entonces el Dis- a la inteligencia humana. La Figura 7 muestra rostros
criminador no será capaz de clasificarlas correctamente. de personas inexistentes generados por StyleGAN, cual-
Por lo tanto, ya no sabe si las imágenes que recibe son quier persona podría pensar que son imágenes de rostros
reales o falsas, y solo puede garantizar con un 50 % de de personas reales; sin embargo, no es así.
certeza que las ha clasificado correctamente. Al lograr La generación de nuevas imágenes a través de RAG
los valores óptimos en el entrenamiento, se alcanza el tiene una importante aplicación en resolver el problema
equilibrio de Nash. de escasez datos. Es un hecho conocido que los modelos
de AP necesitan un gran volumen de datos para ser en-
-0.5 trenados y validados. Sin estos datos, los modelos de AP
son esencialmente inútiles. Entonces, ¿qué hacer cuando
-1 no se tiene la cantidad necesaria de datos? A lo largo de
los años, los investigadores han desarrollado soluciones
-1.5 ingeniosas. El aumento de datos es una de estas solu-
ciones. En lugar de tratar de encontrar nuevos datos, se
-2 construyen otros nuevos basados en los que se tienen.
Máximo en D=0.5 Sin duda, las RAG ayudan a resolver dicho problema de
-2.5 escasez de datos. Otra técnica comúnmente empleada es
la manipulación básica de imágenes (rotación, recorte,
-3 cambio de color, entre otros).
-3.5
0 0.2 0.4 0.6 0.8 1

Figura 6. Función de costo f = a log(D) + b log(1-D(G(Z)))


graficada para varios valores bajo la condición a = b.
Algunas aplicaciones
La concepción de las RAG está enfocada a la generación
de nuevas imágenes a partir de imágenes reales donde
la similitud entre ellas puedan engañar al Discrimina-
dor, y ¿por qué no? también a la inteligencia humana.
A continuación se describen algunas de las extensiones y
aplicaciones de las RAG que se pueden encontrar en el
estado del arte.
Una de sus posibles aplicaciones corresponde al área
de diseño. Por ejemplo, se pueden entrenar las RAG con
imágenes de autos de diferentes marcas de lujo. La arqui-
tectura generaría imágenes de autos con características
similares pero muy probablemente jamás antes vistos.
Esto sin duda, es una aplicación de las RAG que da idea
a los diseñadores de automóviles sobre como pueden lucir
sus próximos diseños.
Sin duda, una de las aplicaciones más vistosas de las
RAG es la generación de rostros. Una característica fun-
damental de un rostro humano son sus imperfecciones.
Intuitivamente, nuestra inteligencia nos permite perci-
bir cuando un rostro es falso porque notamos simetría y Figura 7. Rostros falsos generados por StyleGAN [4].
perfección, lo cual no es realista. Sin embargo, las RAG
se entrenan bajo el principio de generar imágenes falsas En algunas casos de Aprendizaje Supervisado (AS),
caracterizadas por una distribución de probabilidad que las RAG parecen no ser de mucha ayuda en resolver el
sea igual a la de imágenes reales. Esto les permite generar problema de escasez de datos. Esto es debido a que AS

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 57 / 88
requiere que los datos empleados para el entrenamien- como la imagen restaurada, producida por DeblurGAN,
to y la validación de los modelos estén etiquetados o ha mejorado la nitidez con respecto a la borrosa y es si-
clasificados. Sin embargo, las RAG generan datos sin milar a la imagen real. El popular algoritmo de detección
etiquetas. Esto no ha detenido el surgimiento de nuevas de objetos YOLO [7] (You Only Look Once), aplicado a
versiones de RAG para abordar este problema. Una de la imagen borrosa sólo tiene la capacidad de detectar dos
ellas es Conditional GAN, reportada en [5], la cual logró de los cinco objetos detectados en la imagen ideal, con
resultados preliminares en generar nuevas imágenes con una certidumbre en la clasificación de los objetos baja
sus correspondientes etiquetas. Esto, sin duda, es una (50 % y 30 %). Por otra parte, cuando YOLO es aplicado
contribución más de las RAG hacia la solución del pro- a la imagen restaurada, ahora es capaz de detectar cua-
blema de escasez de datos dentro del entorno de AS. tro de los cinco objetos detectados en la imagen ideal,
con una certidumbre más alta en la clasificación.
En [8], se proponen 3D-GAN y 3D-VAE-GAN, las
cuales son extensiones de las RAG para generar objetos
tridimensionales. Aunque las RAG fueron propuestas pa-
ra principalmente tratar con imágenes, con el paso del
tiempo han evolucionado para tratar con datos de otra
naturaleza, como audio, textos e información digital, en-
tre otras. Por ejemplo, en el campo de la Ciberseguridad
se aplican para entrenar la encriptación de una comuni-
cación en lugar de aplicar un método de encriptamiento
conocido [9], y en la creación de audio y musica [10].
El potencial de las RAG para generar datos falsos
indistinguibles de datos reales genera preocupación por
razones éticas y de seguridad. Por ejemplo, las RAG se
podrían utilizar para burlar algunos sistemas de seguri-
dad a través de los datos falsos que generan. Socialmente,
se podrían crear videos y noticias falsas, así como el des-
prestigio de personas a través de imágenes falsas. Las
anteriores preocupaciones sin duda proliferarían con las
redes sociales. Se requiere no sólo la creación de normas
que regulen la aplicación de esta tecnología, sino tam-
bién, la creación de herramientas de inteligencia artificial
que puedan contrarrestar su mal uso.

Conclusiones
Las RAG, inicialmente propuestas en [1], son una ar-
quitectura trascendental de la IA que ha inspirado a
subsecuentes aplicaciones para resolver problemas en di-
versos campos de la ingeniería. La generación de nuevas
imágenes a partir de imágenes reales es la principal apli-
cación de las RAG que, entre otros, resuelve el problema
de escasez de datos. Las imágenes generadas por las
nuevas versiones de RAG, como por ejemplo StyleGAN,
tienen la capacidad de engañar a la inteligencia humana
Figura 8. DeblurGAN [6]. y presentan un desafío para que el ser humano pueda
distinguir su falsedad. A pesar de la inmensa cantidad
DeblurGAN, propuesta en [6], es una arquitectura ba- de propuestas basadas en RAG, es posible establecer
sada en Conditional GAN dedicada a mejorar la calidad algunas vertientes para futuras mejoras; por ejemplo,
de imágenes borrosas. Las capacidades de esta arquitec- garantizar la convergencia al equilibrio de Nash, explo-
tura se ilustran en la Figura 8, donde se observa: a) en la rar nuevas funciones de costo, su extensión a problemas
parte superior la imagen borrosa, b) en la parte central fuera de la visión por computadora así como analizar
la imagen restaurada producida por DeblurGAN, y c) en el impacto cívico y social que implica la generación de
la parte inferior la imagen real ideal. Se puede observar datos falsos.✵

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 58 / 88
6. Kupyn, O., Budzan, V., Mykhailych, M., et al. (2018). Deblur-
GAN: Blind Motion Deblurring Using Conditional Adversarial
Networks. En 2018 IEEE/CVF Conference on Computer Vi-
REFERENCIAS sion and Pattern Recognition, 8183-8192.
1. Goodfellow, I., Pouget-Abadie, J., Mirza, M., et al. (2014). Ge- 7. Redmon, J., Divvala, S., Girshick, R., et al. (2016). You only
nerative adversarial networks. Communications of the ACM, look once: Unified, real-time object detection. En Proc of the
63(11), 139-144. 2016 IEEE Conference on Computer Vision and Pattern Re-
cognition (CVPR), 779-788.
2. Nash, J.F. (1950). Equilibrium points in N -person games. En
Proc of the National Academy of Sciences of the United States 8. Wu, J., Zhang, C., Xue, T. et al. (2016). Learning a probabilis-
of America, 36, 48-49. tic latent space of object shapes via 3D generative-adversarial
3. Nash, J.F. (1951). Non-cooperative Games. Annals of Mathe- modeling. En Proc of the 30th International Conference on
matics, 54(2), 286-295. Neural Information Processing Systems (NIPS’16), 82-90.
4. Karras, T., Laine, S., y Aila, T. (2021). A Style-Based Gene- 9. Meraouche, I., Dutta, S., Tan, H., y Sakurai, K. (2020). Neu-
rator Architecture for Generative Adversarial Networks. IEEE ral Networks-Based Cryptography: A Survey. IEEE Access, 9,
Transactions on Pattern Analysis and Machine Intelligence, 124727-124740.
43(12), 4217-4228.
10. Engel, J., Agrawal, KK., Chen, S., et al. (2019). GANSynth:
5. Mehdi, M., y Osindero, S. (2014). Conditional generative ad- Adversarial Neural Audio Synthesis. En ICLR 2019 Internatio-
versarial nets. Recuperado el 28 de Abril de 2022, de https:// nal Conference on Learning Representations, Nueva Orleans,
arxiv.org/pdf/1411.1784. Luisiana.

SOBRE LOS AUTORES


Leonardo Herrera recibió su grado de Doctor en Ciencias en Instrumentación y Control del Centro
de Investigación Científica y de Educación Superior de Ensenada (CICESE) en 2018, y los grados de
Maestro en Ciencias y Licenciatura en Ingeniería Eléctrica del Instituto Tecnológico de la Laguna en
2011 y 2009, respectivamente. De 2016 a 2017 participó en dos estancias de investigación en NASA, en
NASA LaRC y NASA JPL. Actualmente es un postdoctorante en Mechanical and Aerospace Enginee-
ring Department de Naval Postgraduate School, Monterey, California. Sus intereses de investigación
incluyen Deep Learning, Control de Robots, Navegación, y Filtro de Kalman.
Marlen Meza-Sánchez obtuvo el grado de Doctor en Ciencias en Electrónica y Telecomunicaciones
del Centro de Investigación Científica y de Educación Superior de Ensenada, B.C., (CICESE) en 2011,
y el de Maestro en Ciencias en Sistemas Digitales del Instituto Politécnico Nacional - CITEDI, en
2007. Sus temas de interés incluyen control robusto, sistemas no lineales, control discontinuo, sistemas
subactuados, sistemas embebidos en tiempo real, redes inalámbricas de sensores y actuadores, control
basado en comportamientos analíticos, computación evolutiva, sistemas cooperativos y robótica.
M.C. Rodríguez-Liñán recibió el grado de Licenciatura en Ingeniería Electrónica y el de Maestro en
Ciencias en Ingeniería Eléctrica de la Universidad Autónoma de San Luis Potosí (UASLP), Mexico, en
2006 y 2008, respectivamente; y el grado de Doctor en Ciencias en Ingeniería Eléctrica y Electrónica de
la Universidad de Manchester, Reino Unido, en 2013. De 2014 a 2016, fue posdoctorante en la UASLP,
y de 2016 a 2021 perteneció al sistema Cátedras CONACYT. Sus intereses incluyen Control no lineal,
Sistemas no lineales, No linealidades duras y Control de robots.

Eddie Clemente recibió el grado de Doctor en Ciencias en Ciencias de la Computación en 2015 y el


de Maestro en Ciencias en Ciencias de la Computación en 2006, ambos del CICESE, México. Posee
el grado de Lienciado en Ingeniería Mecatrónica de UPIITA-IPN, México. Actualmente es miembro
de la línea de investigación de Sistemas Cognitivos del TecNM/I.T. Ensenada, México. Sus intereses
incluyen Visión evolutiva por computadora, Robótica y Computación Evolutiva.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 59 / 88
ARTÍCULO ACEPTADO
Análisis de Sentimientos en Twitter
José-Clemente Hernández-Hernández, Daniela Juárez-Morales, Juan-José Guzmán-Landa y Guillermo-
de-Jesús Hoyos-Rivera
Introducción En mayor medida, los estudios del PLN y AS se cen-
Con el incremento en el uso de las redes sociales digita- tran en la red social Twitter, a través de la cual pueden
les, y consecuente explosión de información en formato compartirse textos cortos a manera de opiniones e ideas.
de texto en la Internet, nuestra capacidad de analizar Este tipo de análisis se pretende sea de ayuda para la
todo lo disponible a través de medios humanos se vuel- toma de decisiones de empresas, entidades gubernamen-
ve una tarea totalmente irrealizable. Sin embargo, no se tales, asociaciones, o individuos, al conocer la opinión
puede simplemente ignorar toda esa información, pues de un grupo de población sobre, por ejemplo, algún pro-
puede ser valiosísima, y puede ser utilizada para la toma ducto o servicio [2].
de decisiones. Ante tal disyuntiva, la única vertiente que
se puede aplicar es la del análisis automatizado del texto, Minería de Datos para el Análisis de Sen-
esperando obtener suficiente información de las miles de timientos
expresiones disponibles sobre diversos temas, de manera El proceso del Descubrimiento de Conocimiento en Ba-
que al menos seamos capaces de identificar tendencias de ses de Datos (DCBD) comprende la Minería de Datos
opinión. (MD), que se centra en la utilización de técnicas estadís-
El problema es que el idioma Español es de una com- ticas y algorítmicas para el descubrimiento de patrones
plejidad muy elevada, lo que dificulta su análisis. En el en bases de datos.
área del Procesamiento del Lenguaje Natural, o PLN, En el caso del presente artículo, nos centraremos en
se han hecho importantes esfuerzos para llevar a cabo el describir principalmente el proceso de preparación de
análisis de manera automatizada en diversas lenguas, sin una base de datos de tweets escritos en Español Mexi-
que hasta el momento se haya logrado crear una solución cano, para que posteriormente pueda alimentar un algo-
que se pueda considerar como óptima. En el presente ritmo de clasificación que permita el descubrimiento de
trabajo, pretendemos abordar algunos de los aspectos un sentimiento predominante en ellos: positivo, negativo
elementales relacionados con el pre-procesamiento del o neutral.
texto en castellano, base fundamental para eliminar la En la Figura 1 se muestra el procedimiento del DCBD
mayor cantidad de ruido en el texto, y obtener un má- de manera gráfica para realizar el análisis de los datos en
ximo de información, para su posterior análisis con la cuestión.
finalidad de determinar las tendencias de polaridad con
base en lo escrito.
Orígenes del Análisis de Sentimientos
La comunicación es una necesidad propia de seres socia-
les, como el humano, y desde siempre éste ha tratado
de comunicarse con sus semejantes a través de diferentes
medios, llegando a la máxima expresión con la invención
de la escritura.
Cuando se lleva a cabo la interacción entre personas
es valioso el contexto de la misma. Sin duda, detectar
gesticulaciones, cambio de tono de voz, el lenguaje cor-
poral en general, nos provee una rica perspectiva en el
sentido de las expresiones de nuestro interlocutor. Sin
embargo, cuando las expresiones son emitidas en forma
de texto a través de algún medio digital, se pierde toda
esa riqueza. Es por ello que diversas técnicas de Inteli-
gencia Artificial (IA), específicamente del PLN, han sido
desarrolladas y utilizadas para abordar el problema del
Análisis de Sentimientos (AS), que básicamente es la de-
tección de la polaridad del sentimiento predominante en Figura 1. Proceso del DCBD.
un texto [1].

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 60 / 88

La comprensión de las emociones en texto a través del uso de la


Inteligencia Artificial, puede ser un recurso valioso para determinar
tendencias de opinión.
Para este tipo de análisis los tweets deben pertenecer servar el máximo de información relevante, eliminando
a un tópico en específico, como pueden ser ciencia, políti- tanto ruido como sea posible.
ca, espectáculos, etc. Esto es debido a que cada temática Los pasos básicos en la limpieza de tweets son:
tiene su propio subconjunto de lenguaje y modo de ex-
presarse. Por otro lado, dado que no existe control sobre 1. Convertir el texto en minúsculas, pues el uso de
todo lo que es publicado a través de Twitter, y que cada mayúsculas no aporta información;
usuario expresa sus ideas como le place, no hay forma de
prever el nivel de calidad del texto, ni en términos de su 2. Eliminar acentos, pues su eliminacion no contribu-
nivel de expresividad, ni de su ortografía, o uso de es- ye a reducir el sentido de las expresiones;
tructuras gramaticales. Para lidiar con ello, es necesario
realizar un pre-procesamiento, el cual comprende una se- 3. Eliminar números y signos de puntuación, siempre
rie de tareas conducentes a tratar de eliminar tanto ruido y cuando éstos no formen parte de emoticonos o
somo sea posible. A esto se le conoce como limpieza de emojis;
texto. Elementos como emojis, emoticonos y palabras va-
cías (stop words) pueden agregar sentido, o quitárselo, a 4. Eliminar hashtags, menciones y enlaces de Inter-
lo que se escribe, pero ¿cuáles de éstos son más importan- net, pues son componentes propios de Twitter, y
tes? Frecuentemente dichos elementos son simplemente no aportan información;
eliminados, pero esta acción no necesariamente ayuda.
El siguiente paso es la transformación del texto ya 5. Eliminar el prefijo RT: el cual es indicador de un
limpio a una representación adecuada para que los algo- retweet, y significa que un usuario propagó un
ritmos de Aprendizaje Automático (AA) puedan operar tweet de otro usuario, o uno propio, y no aporta
sobre ellos. Técnicas automáticas han sido utilizadas de información;
manera efectiva, como las bolsas de palabras (BoW) o los 6. Eliminar palabras vacías (stopwords ), siempre y
modelos neuronales de transformación de texto, debido cuando no formen parte de un N-grama de interés;
al auge del Aprendizaje Profundo (AP). Una vez que se éstas son palabras como artículos, preposiciones,
tiene dicha representación, métodos tradicionales, como adverbios, etc.; un N-grama es una composición de
redes neuronales, son empleados en la tarea de clasifica- uso común que consta de más de una palabra como
ción. por ejemplo, “de mala gana”.
Limpieza de datos 7. Tokenización, que es el proceso que consiste en se-
Para entender mejor a qué se refiere este término defi- parar el texto en unidades atómicas, que son las
namos la palabra limpieza : acción y efecto de remover que alimentarán al clasificador.
la suciedad, o los defectos de algo; entonces, llevándolo
al ámbito de las bases datos, podríamos definir limpie- En la Figura 2, se muestra gráficamente el procedi-
za como el proceso de eliminar el ruido en los datos que miento, a través de un ejemplo, de la limpieza y pre-
puede afectar negativamente a un modelo. procesamiento del texto.
Cuando se trata de analizar texto para alimentar un Es fundamental tener otras consideraciones al mo-
algoritmo de AA es normal dedicar una parte sustan- mento de llevar a cabo el pre-procesamiento del texto,
cial del tiempo, hasta un 70 %, a la limpieza del mismo. por ejemplo, ¿qué N-gramas (expresiones comunes for-
Uno de los principales problemas que se presenta en el madas por más de una palabra) debe conservarse en
contenido de redes sociales como Twitter, como ya se el texto?, ¿qué pasa con las siglas?, ¿se deberían man-
mencionó, es que existe total libertad para expresarse, tener los emojis y emoticonos para agregar significado
ignorando frecuentemente las reglas de ortografía y gra- al texto? Es importante señalar que existen diferentes
mática. métodos de limpieza y pre-procesamiento de texto, la
Así, si no se lleva a cabo un adecuado pre- elección del método depende de la tarea de PLN que se
procesamiento del texto, es probable que los resultados esté realizando y de la idea clara del objetivo final.
que se obtengan sean poco precisos. Es fundamental con-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 61 / 88
presentación de los tweets utilizando los vectores de 1s y
0s.

automovil

increible
desastre

pelicula
nuevo
color
cielo

rojo
T1 1 0 1 0 1 1 0 1
T2 0 0 0 1 0 0 1 0
T3 0 1 1 0 1 0 0 1

Figura 3. Representación en 1s y 0s.


Esta representación puede extenderse agregando N-
gramas, aparte de palabras individuales, los cuales serán
considerados como unidades de información indivisibles.
Luego hay que determinar cuántas veces un elemento, ya
sea una palabra o un N-grama, aparece en cada tweet.
Esto último, se puede ampliar para generar una repre-
sentación con respecto a la frecuencia de los términos
(conocida como TF-IDF por sus términos en Inglés [3]),
de manera que los términos obtengan un valor de im-
portancia dentro de un conjunto de textos. En la Figura
4 se muestra el resultado de la representación para los
tweets de ejemplo. Puede notarse que la suma de los va-
lores de cada vector es igual a 1, lo cual quiere decir que
los valores están normalizados.
automovil

increible
desastre

pelicula
nuevo
color
cielo

rojo
T1 0.23 0 0.18 0 0.18 0.23 0 0.18
T2 0 0 0 0.5 0 0 0.5 0
T3 0 0.3 0.23 0 0.23 0 0 0.23
Figura 2. Proceso de limpieza.
Figura 4. Representación con TF-IDF.
Transformación del texto
En esta sección se ilustran, de manera general, los prin- Por otro lado, se encuentran las representaciones que
cipales procesos de transformación del texto, y para esto toman la información de las palabras de las opiniones
tomaremos como ejemplos los siguientes tweets (Ti ): (1) con respecto a su polaridad. Como es el caso del cono-
“¡Mi automóvil nuevo es color rojo! #increíble” (positi- cido recurso léxico SentiWordNet, que contiene palabras
vo), (2) “¡Esa película fue un desastre!” (negativo), y (3) en Inglés con su respectivo nivel de positividad, negati-
“El cielo de color rojo es increíble” (positivo). Con la fina- vidad y neutralidad [4]. Hay otro tipo de representación
lidad de ilustrar también el caso de un tweet de polaridad de palabras, que toman en cuenta su significado semán-
neutral, podemos considerar “Esta tarde va a llover”. tico, como la emoción a la que pertenecen o el campo
La forma más sencilla de representar los tweets de semántico al que corresponden [5, 6].
ejemplo, es a través de un vector de 1s y 0s conocido co- Una representación más es la que generan los modelos
mo one-hot-encoding, cuya longitud corresponde con el neuronales pre-entrenados [8], como Word2Vec, BERT,
número de palabras en los tweets después de la limpie- ELMo, FastText, GloVe y GPT. Estos modelos generan
za y pre-procesamiento. Tomando en cuenta estos tweets, un vector por palabra o dependiendo del modelo, los to-
después de realizada la tokenización, se observan que son kens de sub-palabras utilizando WordPiece. Este tipo de
8 las palabras base para el análisis: automovil, nuevo, representaciones, normalmente se transforman en datos
color, rojo, increible, pelicula, desastre y cielo. De esta de dos dimensiones, teniendo como resultado, una matriz
manera, el vector será, entonces, de longitud 8. Cada va- por tweet u opinión.
lor en el vector, representa a un elemento encontrado en Retomando los tweets de ejemplo, se tiene que el to-
los tweets. En la Figura 3 se observa gráficamente la re- tal de palabras que proveen de información en el tweet,

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 62 / 88
después de la tokenización es 5; este valor es el total de escritas más comunes, (2) identificación de bi-gramas y
filas que la representación matricial tendrá. La cantidad tri-gramas de interés, y (3) inclusión de emojis y emoti-
de columnas de la matriz depende del modelo utilizado, conos para el proceso de entrenamiento. Todo esto, con
e. g., con el modelo BERT es 768. Dicho número es el el objetivo de enriquecer la información contenida de ma-
tamaño del vector continuo que representa a las palabras nera natural en el texto.
de una sentencia1 . Este modelo es entrenado utilizando La evaluación de los modelos fue llevada a cabo a
tareas del PNL como la predicción de palabras y senten- través de un método conocido como Validación Cruzada
cias. En la Figura 5 se ve gráficamente la representación (VC) [9], en el cual la totalidad de los datos se divide en
de este modelo, utilizando el primer tweet de ejemplo. grupos distintos para el entrenamiento y posterior prue-
ba de los clasificadores (90 % y 10 %, respectivamente).
automovil 0.12 0.74 -0.09 ... 0.66 Un ejemplo de la experimentación llevada a cabo se en-
nuevo 0.41 0.41 -0.39 ... -1.39
color -0.39 0.61 -0.01 ... -0.66 cuentra en esta referencia [10].
rojo -0.33 -0.68 0.32 ... -1.12 Luego de varias semanas de intensos procesos de ex-
increible -0.38 0.55 0.35 ... -0.92 perimentación, los cuales requirieron de una cantidad
considerable de cómputo que nos fue facilitada por la su-
Figura 5. Representación con BERT. percomputadora Leo Atrox, de la Universidad de Guada-
lajara3. Los resultados obtenidos muestran una mejora,
Análisis de Sentimientos tanto en la precisión, como en el tamaño del modelo utili-
zado. Además se encuentran diferencias en los resultados
Una vez que los datos están completamente transforma-
dos, es momento de realizar la MD. Para dar un ejem- de los clasificadores al probar con las dos representacio-
plo, en esta sección se describen los elementos básicos nes propuestas.
de la investigación llevada a cabo por los autores, ex- Con respecto a la búsqueda del AG, éste encuentra
plorando distintas herramientas de AA y de AP para la estructuras menores de acuerdo al número de paráme-
clasificación del texto en diferentes polaridades: positi- tros, en comparación con la RNC que fue extraída de
vos, negativos y neutrales. Dicha investigación requirió la literatura, reduciéndolos hasta en un 96 %. Estos mo-
de 3161 tweets por polaridad, que fueron proporciona- delos generados de manera automática, también logran
dos y etiquetados por el Centro de Estudios de Opinión obtener mejores resultados que la RNC por defecto y los
y Análisis de la Universidad Veracruzana 2 . clasificadores tradicionales de AA en varios de los ca-
La tarea principal fue clasificar texto con respecto a sos de la VC ejecutada. Por otro lado, la representación
sus polaridades utilizando técnicas tradicionales de AA, ofrecida por el modelo BERT hace que los modelos de
y de AP. Los clasificadores seleccionados fueron: Máqui- clasificación incrementen aproximadamente un 15 % la
na de Soporte Vectorial (MSV), Ingenuo Bayesiano (IB) precisión.
y una Red Neuronal Convolucional (RNC) extraída de la Como trabajo futuro, se tiene planeado mejorar nues-
literatura [8] (RNC por omisión). En contraste, se pro- tros procesos de limpieza, así como realizar nueva expe-
puso utilizar una herramienta de Computación Evolutiva rimentación para reconocer los patrones que hacen que
(CE) llamada Neuroevolución (NE) para generar mode- los modelos reduzcan su tamaño, y la aplicación del AG
los que pudieran mejorar los resultados y, muy posible- sobre otros modelos, como los de transformación de tex-
mente, realizar modificaciones importantes sobre las es- to.
tructuras de los clasificadores neuronales, básandose en Desde luego, el AS contempla tareas que son un de-
la RNC por omisión. Un Algoritmo Genético (AG) fue safío para los científicos, y la labor de éstos es probar
la opción para realizar la búsqueda de los modelos con diferentes técnicas para lograr mejorar distintos aspectos
los requerimientos deseados. del proceso de la MD. Uno de éstos es buscar reducir
Dos modelos neuronales de transformación del tex- el tiempo computacional utilizado para el aprendizaje
to fueron utilizados: Word2Vec y BERT. Realizando la de los modelos, pues es importante tomar en cuenta la
limpieza del texto previa, estos modelos fueron alimen- huella de carbono que genera el cómputo de modelos
tados para generar representaciones de los tweets y con computacionalmente demandantes. ✵
la intención de observar qué representación conduce a los
clasificadores a obtener mejores resultados. Actualmente,
se está afinando el proceso de pre-procesamiento del tex- REFERENCIAS
to con la finalidad de agregar elementos de información 1. Liu, B. (2015). Sentiment analysis: mining opinions, sentiments,
que puedan ser útiles, (1) identificación de palabras mal and emotions. New York, NY: Cambridge University Press.
1 La cantidad de elementos en cada vector ha sido definido por los autores de cada uno de éstos, sin precisar el criterio utilizado para la
decisión
2 https://www.uv.mx/centrodeopinion/
3 https://cgsait.udg.mx/cads/

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 63 / 88
2. Singh, N. K., Tomar, D. S., y Sangaiah, A. K. (2020). Senti- 7. Babić, K., Martinčić-Ipšić, S., y Meštrović, A. (2020). Survey of
ment Analysis: A Review and Comparative Analysis over So- Neural Text Representation Models. Information, 11(11), 511.
cial Media. Journal of Ambient Intelligence and Humanized
Computing, 11(1), 97-117.
8. Kim, Y. (2014). Convolutional neural networks for sentence
3. Salton, G., y Buckley, C. (1988). Term-weighting approaches in classification. En EMNLP 2014 - 2014 Conference on Em-
automatic text retrieval. Information Processing & Manage- pirical Methods in Natural Language Processing, Proceedings
ment. 24(5), 513–523. of the Conference, 1746-1751.
4. Baccianella, S., Esuli, A., y Sebastiani, F. (2010). SENTI-
WORDNET 3.0: “An enhanced lexical resource for sentiment 9. Scikit-learn developers. (2021). Cross-validation: evaluating es-
analysis and opinion mining”. En proceedings of the 7th Inter- timator performance, de Scikit-learn. Recuperado en enero
national Conference on Language Resources and Evaluation, del 2022, de https://scikit-learn.org/stable/modules/cross_
LREC 2010, 2200-2204. validation.html.
5. Rangel, I.D., Sidorov, G., y Guerra, S. S. (2014). Creación y
evaluación de un diccionario marcado con emociones y ponde-
rado para el español. Onomazein, 29(1), 31-46. 10. Hernández-Hernández, J.-C., Mezura-Montes, E., Hoyos-
Rivera, G.-J., y Rodríguez-López, O. (2021). Neuroevolution for
6. Rodríguez, O., y de-Jesús-Hoyos, G. (2019). A Simple but Po- Sentiment Analysis in Tweets Written in Mexican Spanish. En
werful Word Polarity Classification Model. En L. Martínez- E. Roman-Rangel, Á. F. Kuri-Morales, J. F. Martínez-Trinidad,
Villaseñor, I. Batyrshin & A. MarínHernández (Eds.). Advances et al. (Eds.). Pattern Recognition MCPR 2021. Lecture Notes
in Soft Computing, 11835, 51-62. in Computer Science, 12725, 101-110.

SOBRE LOS AUTORES


José-Clemente Hernández-Hernández Licenciado en Tecnologías Computacionales y Maestro en
Inteligencia Artificial por la Universidad Veracruzana. Profesor de asignaturas en la Escuela de Inge-
nierías de la Universidad de Xalapa, e instructor y asesor de temas de Informática y de Inteligencia
Artificial. Inclinaciones de investigación en el área del procesamiento del lenguaje natural en la lengua
Española, en conjunto con técnicas de cómputo evolutivo, redes neuronales y aprendizaje profundo.
Apasionado de la programación, aficionado a lecturas tanto científicas como de entretenimiento, y
amante de la Astronomía.
Daniela Juárez-Morales Estudiante de octavo semestre de la licenciatura en Estadística de la Uni-
versidad Veracruzana. Con conocimientos sólidos en métodos estadísticos, diseño y análisis de experi-
mentos, métodos no paramétricos, visualización de datos y análisis de textos. Apasionada del Machine
Learning y la Ciencia de Datos. En lo personal, practicante de gimnasia artística, y amante de la
naturaleza.

Juan-José Guzmán-Landa Licenciado en Tecnologías Computacionales y estudiante de segundo


semestre de la maestría en Inteligencia Artificial por la Universidad Veracruzana. Con intereses de
investigación en el área del procesamiento del lenguaje natural en la lengua Española, así como las
técnicas de cómputo evolutivo, redes neuronales y aprendizaje profundo. En lo personal, aficionado a
los efectos especiales, la gastronomía y la orquesta.
Guillermo-de-Jesús Hoyos-Rivera Licenciado en Informática y Maestro en Inteligencia Artificial
por la Universidad Veracruzana, y Doctor en Informática por la Universidad Paul Sabatier, de Toulouse,
Francia. Investigador de tiempo completo en el Instituto de Investigaciones en Inteligencia Artificial, y
profesor de asignatura en la Facultad de Matemáticas, ambos de la Universidad Veracruzana. Consultor
independiente en desarrollo e implementación de sistemas informáticos. Con intereses de investigación
en análisis de polaridad de sentimientos en texto en español mexicano, cómputo de alto desempeño,
redes de computadoras y sistemas Web, entre otros. En lo personal, aficionado al motociclismo, a la
carretera, y a viajar.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 64 / 88
ARTÍCULO ACEPTADO
Importancia de la minería de opinión en redes
sociales en español
Fernando Monroy Tenorio, Janeli Astorga Villela y Aleli Castro Orellana
Opinión en redes sociales La minería de opinión denominada también análisis
La persona que emite una opinión busca aportar infor- de sentimiento, se centra en tratar automáticamente in-
mación con el propósito de provocar una reacción, por lo formación con opinión, lo que permite, entre otras cosas,
que, aunque se pueda tener una opinión individual, esta extraer la polaridad (positiva, negativa, neutra o mixta)
adquiere mayor importancia cuando se comparte a nivel de un texto [1].
interpersonal; así, la opinión se expresa en círculos so- El análisis de sentimiento es una tarea desafiante que
ciales de diferentes magnitudes que rodean al individuo combina técnicas de Minería de Datos y PLN para tra-
[6]. tar computacionalmente la subjetividad en documentos
El uso de Internet en los países que hablan español va de texto.
en aumento, por ejemplo, en México para el 2020 según La relevancia de la minería de opinión se da por la
Asociación de Internet Mexicana, existen 84.1 millones expansión de Internet y la Web 2.0 como blogs, tweets,
de internautas, representando el 72.0 prensa en línea, páginas web de hoteles, restaurantes, li-
Dentro de las diferentes redes sociales los internautas bros, etc. [3]. Dentro de estas páginas la diversidad y
vierten comentarios y opiniones sobre distintos aspectos cantidad de críticas presentes resultan de gran utilidad a
que incluyen lo personal, comercial, empresarial y polí- fabricantes y vendedores, que ven en ella un mecanismo
ticos, entre otros. para conocer de primera mano cómo sus artículos son
La opinión se puede estudiar desde un enfoque so- percibidos por los consumidores [4].
cial, humanístico, psicológico, lingüístico, filosófico, polí- Mucha gente escribe sus opiniones en redes sociales
tico, administrativo, de marketing, etc. La opinión puede como Facebook, Twitter, Instagram, entre otras. Esta
representar algo tan simple y común como la cotidianei- información es muy útil para las empresas, líderes de
dad de una persona o algo sumamente complejo como opinión, negocios, gobierno y los individuos en general,
tratar de cuantificar algo que es subjetivo, dependiendo que quieren seguir las actitudes y sentimientos en forma
del campo desde donde se aborde [6]. automática dentro de las redes sociales. Como mencio-
Para nuestro campo de estudio nos centramos en na [5] hay una gran cantidad de datos disponibles que
poder automatizar la detección y clasificación de las opi- contienen mucha información útil, por lo que puede ser
niones a través de una computadora, ayudándonos de analizada de forma automática.
técnicas de Procesamiento de Lenguaje Natural (PLN) La mayoría de los trabajos de investigación que exis-
que forma parte de la Inteligencia Artificial. ten relacionados con la minería de opinión y su aplicación
en redes sociales se centra en textos en el idioma inglés.
Análisis de opinión en redes sociales Así como la mayoría de los recursos como corpus, léxicos,
El análisis de opinión en las redes sociales, se puede ata- entre otros; están diseñados para este idioma. Es por eso
car de manera automática a través de la minería de opi- que tener métodos eficientes en otros idiomas como el
nión o análisis de sentimiento. Esta es una tarea difícil español es de suma importancia.
debido a la subjetividad que implica, ya que incluso los
seres humanos muchas veces no coincidimos cuando in- Clasificación de polaridad
tentamos clasificar una opinión o comentario. Dentro de la minería de opinión como mencionamos an-
Dentro del Procesamiento de Lenguaje Natural teriormente, se pude extraer la polaridad que consiste en
(PLN) la subjetividad es la expresión lingüística de cual- determinar si una palabra comunica una actitud positiva
quier opinión, sentimiento, emoción, evaluación, creen- o negativa; se encuentra en verbos, pronombres, adjeti-
cias y especulación [1]. vos y adverbios. Puede cambiar la connotación de una
Pang and Lee [2] mencionan que los términos “análisis frase o un texto.
de sentimientos” y “minería de opiniones” hacen referen- Por ejemplo, en la frase “Mi Internet es muy rápido”
cia a una misma tarea y que éstas son un subconjunto de la polaridad es positiva ya que la palabra rápido es algo
una tarea mayor que es el análisis de subjetividad. Asi- bueno. Sin embargo, la misma palabra en otro contexto,
mismo, Wilson (2009) entiende la tarea del análisis de por ejemplo, en: “La batería de mi coche se descargó muy
sentimientos como un subconjunto del análisis de subje- rápido” tiene una polaridad es negativa, ya que rápido en
tividad. este contexto es algo desfavorable.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 65 / 88
Analicemos el ejemplo dado por [7] para entender me- el sentimiento. También se consideran cambiadores de
jor el problema, el texto es una reseña de una cámara sentimiento que son palabras que pueden afectar la po-
extraída de un corpus de minería de opinión: laridad de una oración como la negación.
“Compré una cámara Canon G12 hace seis meses. Un ejemplo de estos cambiadores contextuales de po-
Simplemente la amo. Las fotografías tienen una calidad laridad podría ejemplificarse con las siguientes frases: “Mi
increíble. La batería dura mucho tiempo. Sin embargo, Internet es muy rápido”, que claramente es una oración
mi esposa piensa que es muy pesada para ella” [7]. positiva y “Mi Internet no es muy rápido”, que al agregar
Como vemos el texto se puede dividir en varias fra- la palabra “no”, genera la negación y cambia la polaridad
ses y cada una de ellas expresa una opinión y a su vez del término -siendo ahora negativa-.
todo el texto puede denotar opinión. Las primeras tres Aportaciones Nuestro trabajo en el campo de la cla-
frases expresan claramente una opinión positiva. La frase sificación de la polaridad se centra en el análisis de la
cuatro es implícitamente positiva ya que una batería de polaridad añadiendo información sintáctica utilizando n-
larga duración es algo bueno. La última oración expresa gramas sintácticos (sn-gramas) como características de
también una opinión implícita, en este caso es negativa entrenamiento en diferentes clasificadores de aprendizaje
ya que la cámara es demasiado “pesada” [7]. supervisado como máquinas de soporte vectorial y naive
La clasificación de la polaridad se puede dar en varios bayes [10].
niveles: a nivel de documento, de sentencia o de aspecto.
El aspecto esta relacionado con la entidad. En el caso del La investigación se justifica debido a que, en gran
ejemplo anterior la cámara es la entidad y sus aspectos parte de los trabajos donde se utiliza el enfoque basa-
son por ejemplo la calidad de la imagen y la batería. do en aprendizaje automático, se utilizan palabras como
Esta tarea se ha trabajado desde tres enfoques prin- características de entrenamiento; con lo anterior, como
cipales, que son: el aprendizaje supervisado, aprendizaje menciona [5], se pierde información sobre las relaciones
no supervisado y el basado en léxico. sintácticas entre palabras. Las palabras se convierten en
En el aprendizaje supervisado, que requiere datos eti- lo que se llama “bolsa de palabras”. Otras característi-
quetados para poder entrenar un clasificador. Se etiqueta cas utilizadas para la clasificación de opiniones son los
la polaridad o el sentimiento a nivel de la oración; en el n-gramas tradicionales, que son secuencias de palabras
caso de las redes sociales, por ejemplo Twitter se etiqueta tal como aparecen en un documento.
a nivel de un Tweet. Los clasificadores que se han usado Utilizamos sn-gramas como características para evi-
en este enfoque, en el estado del arte son: naive bayes, tar la pérdida de información sintáctica en un enfoque
máquinas de soporte vectorial, redes neuronales y redes basado en aprendizaje automático y con esto mejorar la
bayesianas, entre otros. clasificación de la polaridad.
Según [5] los sn-gramas pueden ser utilizados como
características de clasificación de la misma manera que
n-gramas tradicionales, por lo tanto, en cualquier tarea
que se utilicen n-gramas tradicional se pueden aplicar
también sn-gramas.
La desventaja de los sn-gramas es que requieren del
análisis sintáctico previo. La idea de los sn-gramas se
justifica con la introducción de información lingüística
a métodos estadísticos, con esto se pretende superar la
desventaja tradicional de n-gramas de contener muchos
elementos arbitrarios, es decir, una gran cantidad de rui-
do.
La diferencia entre los n-gramas y los sn-gramas es la
forma en que elementos son considerados como vecinos.
En el caso de los sn-gramas, los vecinos se toman siguien-
do relaciones sintácticas en los arboles sintácticos, y no
mediante la adopción de las palabras tal y como aparecen
Figura 1. Esquema sobre las técnicas de clasificación apli- en el texto.
cadas en el análisis de sentimiento. Los sn-gramas que utilizamos como características
para la etapa de clasificación se obtienen a partir de un
El enfoque basado en léxico se basa en listas (diccio- árbol de dependencias. Estos árboles de dependencia sin-
narios o corpus) de palabras, frases, modismos, expre- táctica los generamos con una suite de herramientas para
siones compuestas y reglas de opinión para determinar análisis del lenguaje llamada FreeLing en su versión 1.3

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 66 / 88
esta tarea. Existe el kit de herramientas de lenguaje na-
tural NLTK, que es un conjunto de bibliotecas que nos
ayudan a realizar varias tareas de pre procesamiento so-
bre los datos de entrenamiento para los experimentos.
Existe incluso una biblioteca de Python especializa-
da para el análisis de sentimiento en español (sentiment-
spanish), la cual utiliza redes neuronales para predecir
el sentimiento en oraciones en español. Otra librería en
Python es PySentimiento, que es un toolkit para extrac-
ción de opiniones y análisis sentimiento centrado en el
idioma español.
El TASS (Taller de Análisis Semántico) nos ofrece va-
rios recursos. El taller lo realiza la Sociedad Española de
Procesamiento de Lenguaje Natural (SEPLN), quienes
cada año, desde el 2012, organizan un taller de análi-
Figura 2. Ejemplo de un Árbol de dependencia sintáctica sis de sentimiento, en donde los participantes proponen
creado con la herramienta FreeLing Versión 1.3. diferentes metodologías para resolver esta tarea.
TASS cuenta con su propio corpus creado para las di-
En nuestro trabajo utilizamos un corpus de críticas ferentes tareas, con el que los participantes realizan sus
de películas en español, MuchoCine, que contiene 3878 experimentos y evalúan sus resultados. Existe un corpus
reseñas de películas recolectadas con aproximadamente en español con tweets marcados con su polaridad positi-
2 millones de palabras, con una media de 546 palabras va, negativa o neutra.
por crítica. Si se desea realizar la extracción directa de las redes
sociales, la mayoría nos provee de una Interfaz de pro-
gramación de aplicaciones (API), para poder acceder y
minar su contenido.
La primera API es la de Twitter, que puede realizar
hasta 300 requerimientos por aplicación cada 15 minutos.
Debes tener una cuenta de desarrollador. Existen libre-
Figura 3. Ejemplo de bigramas sintácticos y bigramas tra- rías de Python que ayudan a consumir esta API, como
dicionales de la “frase cada vez me gusta menos el cine de Tweepy.
masas”. Facebook también proporciona una API para realizar
tareas de lectura y escritura sobre páginas de Facebook,
Utilizamos como clasificador máquinas de soporte grupos, eventos, etc. El nivel de acceso y elementos está
vectorial, que son de los clasificadores que mejores re- determinado por sus políticas y restricciones.
sultados arrojan en esta tarea. Junto con varios sets de También existen herramientas como Sentitext, de la
datos para mejorar la clasificación; además comparamos Sociedad Española para el Procesamiento de Lenguaje
los resultados, con los obtenidos al usar n-gramas tradi- Natural, que es, un sistema cliente servidor para el aná-
cionales. Los resultados se pueden consultar en [10]. lisis de sentimiento en español.
La cantidad de recursos es limitada y la gran canti-
Recursos y herramientas para la clasifica- dad de información que se genera día a día en las redes
ción de polaridad en español sociales, en idioma español crece exponencialmente. Por
ese motivo es necesario generar recursos y herramientas
Cada idioma tiene sus propias particularidades y reglas,
tanto sintácticas como semánticas. Por esta razón es im- que nos ayuden a mejorar la precisión del análisis.
portante generar recursos en idioma español, para poder
aplicar las técnicas o enfoques que se han realizado en su Conclusiones
mayoría en idiomas como el inglés. Actualmente hay una tendencia en el aumento de tra-
Existen recursos como el léxico específico en español bajos referentes al análisis de sentimiento o minería de
de redes sociales [8], que contiene 271 palabras inclu- opinión en redes sociales, la mayoría en el idioma inglés.
yendo emoticones con una corta definición. El corpus de Se trabaja, además de los enfoques que mencionamos, el
tweets en español [9] que clasifica los tweets con seis emo- uso del aprendizaje profundo para la clasificación de la
ciones básicas con un total de 3000 tweets por emoción. polaridad.
Python es uno de los principales lenguajes de progra- En el idioma español cada vez contamos con más re-
mación que se utilizan actualmente para poder estudiar cursos y con el avance logrado en otros idiomas, que nos

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 67 / 88
ayudan a mejorar la eficiencia, al clasificar la polaridad 2. Pang, B., y L. Lee. (2008). Opinion mining and sentiment analy-
en nuestro idioma. sis. Foundations and Treands, 2(1-2), 1-135.
En este articulo hablamos de las generalidades que 3. Ortiz, A.M., Castillo, F.P., y García, R.H. (2010). Análisis de
tiene la minería de opinión y, en específico, de la clasifica- Valoraciones de Usuario de Hoteles con Sentitext: un sistema
de análisis de sentimiento independiente del dominio. Procesa-
ción de la polaridad. Existen además otros sentimientos miento del lenguaje natural, 45, 31-39.
que se pueden detectar usando minería de opinión como: 4. Vilares, D., Alonso, M.Á., y Gómez, C. (2013). Clasificación de
la ironía, la depresión, el sarcasmo, la felicidad, etc. polaridad en textos con opiniones en español mediante análisis
También es importante entender la complejidad del sintáctico de dependencias. Procesamiento del lenguaje natu-
ral, 50, 13-20.
tratamiento de los datos. Cada red social maneja for-
matos diferentes y, aunque en su mayoría son textua- 5. Sidorov, G., Velasquez, F., Stamatatos, E., Gelbukh, A.,
Chanona-Hernández, L. (2012). Syntactic dependency-based n-
les, incluyen elementos que pueden hacer mas difícil su grams as classification features. Mexican International Confe-
clasificación, como son: emoticones, faltas ortográficas, rence on Artificial Intelligence, Springer, Berlin, Heidelberg,
1-11.
abreviaciones, modismos, etc.
Es un hecho que los avances en la minería de opinión, 6. Librado , H. (2016). Análisis automático de opiniones de pro-
ductos en redes sociales. Tesis de maestría, Maestría en Ciencias
se han dado en mucho menor grado en el idioma español, de la Computación. Centro de Investigación en Computación,
pero, al ser este uno de los idiomas mas hablados a nivel México.
mundial, es importante alentar cada vez a mas grupo de 7. Pazos, I.O. (2014). Polarity summarization with opinion mi-
investigación a participar con sus aportaciones; de esta ning. Tesis de maestría, Maestría en Ciencias de la Compu-
tación. Centro de Investigación en Computación, México.
forma será posible mejorar la eficiencia de los resultados
y, generar nuevos métodos y algoritmos capaces de ha- 8. Osuna, F.,Minjares, K., y Sidorov, G. (2017). Compilation of
Spanish Specific Lexicon of Social Networks.
cer realidad el análisis de sentimiento automatizado, en
redes sociales, en idioma español.✵ 9. Camacho, V., Sidorov, G., y Galicia, N. (2016). Construcción
de un corpus marcado con emociones para el análisis de senti-
mientos en Twitter en español. Revista escritos BUAP,1(1).
REFERENCIAS 10. Monroy, F. (2017). Medidas de asociación en escalas bipolares
para la minería de opinión en redes sociales. Tesis de doctorado,
1. Wiebe, J.M. (1994). Tracking point of view in narrative”. Doctorado en Ciencias de la Computación, Centro de Investi-
Computational Linguistics, 20(2), 233-287. gación en Computación, México.

SOBRE EL AUTOR

Fernando Monroy Tenorio graduado como doctor en Ciencias de la Computación en el Centro


de Investigación en Computación del Instituto Politécnico Nacional. Actualmente se desempeña como
director de TI en la empresa COINTIC. Las líneas de investigación de su intéres son: procesamiento
de lenguaje natural, análisis de sentimiento e inteligencia artificial.

Janeli Astorga Villela obtuvo el grado de maestra en Dirección de Tecnologías de la Información,


egresada de la Universidad de España y México. Actualmente es profesora en la Universidad UniverMi-
lenium. Es profesora en la Escuela Preparatoría Oficial número 50 en el Estado de México. Sus temas
de intéres son realidad aumentada y análisis de sentimientos.

Gizeth Aleli Castro Orellana es candidata al Doctorado en Administración Gerencial por la Uni-
versidad Tecnológica de Honduras, graduada como maestra en Administración de Empresas por la
Universidad de San Pedro Sula Honduras. Actualmente es profesora investigadora en la Universidad
Tecnológica de Honduras, los temas de investigación de su inéres son relidad aumentada y machine
learning.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 68 / 88
ARTÍCULO ACEPTADO
Algunos resultados de control distribuido de
múltiples robots
Héctor M. Becerrra, Miguel A. Trujillo, David Gómez Gutiérrez y Javier Ruiz León
Introducción una inspiración biológica, por ejemplo, en el comporta-
Actualmente, existe un gran interés en la comunidad de miento de bandadas de aves.
robótica en el diseño y análisis de sistemas donde un con- En el control de formaciones basado en consenso, fre-
junto de robots interactúa, se coordina o coopera para cuentemente se utilizan agentes virtuales y se define la
realizar una tarea compleja sin la necesidad de un coordi- formación de tal manera que, si se logra consenso en las
nador central. Esto proporciona robustez y redundancia coordenadas de los agentes virtuales, se logra la forma-
para realizar la tarea, o incluso permite realizar tareas ción, como se ilustra en la Figura 1.
que no son posibles con un solo robot.
Un ejemplo popular de un sistema multi-robot (SMR) Agente 1

es un espectáculo luminoso, como el que recientemente Agente Virtual 3

se ha presentado por diferentes compañías utilizando una Agente Virtual 1

gran cantidad de cuadricópteros, donde cada uno es un


Agente Virtual 2
Agente 3

pixel de una animación. Sin embargo, estos espectáculos


son una cuidadosa coreografía donde las posiciones de
Agente 2

los robots y sus trayectorias son determinadas a priori.


Posiciones Iniciales

Una desventaja de los sistemas centralizados como és-


te es que la tarea no puede desempeñarse si el sistema
central falla.
Para abordar esta problemática, la comunidad de ro-
bótica y control automático trabaja en el diseño de al-
goritmos de control distribuido de formaciones, donde Consenso en la coordenada Consenso en las coordenadas y

cada robot cuenta con una ley de control para lograr la


formación mediante la interacción entre los robots; por Figura 1. Formación que se obtiene a partir del consenso de
ejemplo, ajustando su posición con base en las posicio- agentes virtuales.
nes relativas de sus vecinos sin la necesidad de un sis-
tema central. El control distribuido de formaciones de Existen varios retos para la aplicación del control
un SMR es importante en aplicaciones como inspección de formaciones. El objetivo de este artículo es presentar
de estructuras, cinematografía o captura de un escenario soluciones para algunos de ellos, por ejemplo, evitar que
dinámico, monitoreo de grandes áreas para acciones de los robots colisionen con objetos del ambiente, o incluso
rescate, y transporte cooperativo de un objeto. con otros robots. Se considerarán robots cuadricópte-
El análisis y diseño de control distribuido para un ros y robots de ruedas como agentes. Una opción para
SMR frecuentemente utiliza dos componentes [5]: un gra- que un SMR logre una formación evitando colisiones es
fo de comunicación que describe (para cada robot) cuales mediante un control jerárquico basado en tareas. Este
agentes influyen de manera directa en su comportamien- permite combinar diferentes controladores sin conmutar
to, y un algoritmo matemático que determina cómo los de uno a otro de forma discontinua. Otro reto del control
robots deben ajustar su comportamiento basados en la de formaciones es mantener la conectividad entre agen-
información que reciben de los robots vecinos. El lector tes, lo cual se puede incorporar como una restricción
puede consultar [3,6] para una revisión detallada de la de un control basado en optimización. A continuación
literatura reciente en control de formaciones. se describen soluciones a estos retos de interés en el área.
Uno de los métodos básicos en el diseño de controla-
dores para un SMR es un algoritmo de consenso, el cual Control de formaciones sin líder
permite que los agentes en un sistema distribuido logren En el control de formaciones hay dos casos, dependiendo
un acuerdo sobre una variable de interés. Esto es posible de si uno de los robot tiene la función de ser un líder
cuando el grafo de comunicación es un grafo conectado; o si ninguno actúa como tal. En el caso sin líder, el ob-
es decir, la información puede fluir entre cualquier par jetivo es que los robots alcancen una forma geométrica
de agentes. De esta manera, el SMR logra un comporta- predefinida, donde lleguen a posiciones relativas especi-
miento global a partir de interacción local, lo cual tiene ficadas en la formación deseada sin importar la posición

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 69 / 88
global de la misma. En contraparte, la función del líder los obstáculos fijos (columnas cilíndricas) que se encuen-
es que el SMR pueda navegar en un entorno y realizar tran en el espacio de trabajo y con los demás robots.
tareas bajo su guía, por lo que el líder impone una posi-
ción global para la formación. En la práctica, el control
de un SMR debe considerar resolver dos tareas (posible-
mente conflictivas), lograr la formación deseada y evitar * Posición inicial
° Posición final
colisiones.
Existe en la literatura un algoritmo matemático ba-
sado en la combinación de múltiples tareas [1] que per-
mite a un robot cumplir con dos tareas al mismo tiempo.
Cada una de las tareas encargadas de alcanzar los obje-
tivos establecidos tiene una jerarquía preestablecida. En
el control de formaciones con evasión de colisiones, la ta-
rea principal es evitar colisiones, mientras que la tarea
secundaria es alcanzar la formación especificada [7].
Algo que se debe de evitar en los esquemas de com-
binación de múltiples tareas son las discontinuidades en
las entradas de control (velocidades de los robots) debi- Figura 3. Trayectorias de los agentes para alcanzar la for-
do al cambio de prioridad, ya que ante cambios abruptos mación especificada evitando colisiones.
de velocidad, los robots son incapaces de realizar las ac-
ciones de control necesarias para cumplir con sus obje- El algoritmo que se detalla en [7] también permite
tivos. Para evitar este problema, se incluye una función realizar la evasión de obstáculos irregulares. La Figura 4
de transición suave entre leyes de control. muestra las trayectorias de 5 robots desde su posición
Algoritmos de control de formaciones se han evaluado inicial hasta alcanzar una formación en pentágono, lo-
utilizando el simulador dinámico Gazebo para un grupo grando evitar colisiones con los obstáculos del entorno,
de 7 cuadricópteros. El esquema de control distribuido los cuales en la figura se muestran como polígonos en lí-
para cada cuadricóptero recibe información de la posi- neas gruesas. Se define un radio de seguridad para cada
ción de los robots vecinos para calcular el error de con- agente (circunferencias punteadas en la figura), el cual no
senso de agentes virtuales y calcular velocidades propor- debe ser traspasado por ningún obstáculo. Las leyes de
cionales a este error. Se utiliza un modelo de movimiento control (velocidades de traslación en x, y) se mantienen
simplificado del cuadricóptero, considerando que se con- continuas mientras se alcanza la formación deseada.
trolan las posiciones (x, y, z ) y que las entradas de control 8

son las velocidades de traslación lineal en cada coorde-


nada, así que el modelo es un integrador simple. 6 * Posición inicial
° Posición final
4

Links de Agentes
comunicación 2

-2

-4
-6 -4 -2 0 2 4 6 8 10 12 14

Figura 4. Trayectorias de los agentes realizando evasión de


colisiones con obstáculos irregulares.
Figura 2. Grafo de comunicación y formación deseada para
7 cuadricópteros. Control de formaciones con líder
En esta sección se describe un trabajo desarrollado para
En la Figura 2 se muestra la red de comunicación en- robots terrestres tipo uniciclo [4], para el caso en que uno
tre cada uno los agentes móviles representados por los 7 de los robots actúa como líder. Este tipo de robots se ca-
cuadricópteros en la formación deseada. Las trayectorias racteriza por tener restricciones de movimiento similares
de cada uno de los robots desde una posición inicial a a las de un carro convencional que no se puede desplazar
una final se presentan en la Figura 3, donde los cuadri- lateralmente, pero a diferencia de un carro, son capaces
cópteros alcanzan la formación evitando colisiones con de girar en sitio sobre su propio eje.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 70 / 88
Consideramos un grupo de robots tipo uniciclo, todos to Optitrack, un sistema de 12 cámaras que mediante
caracterizados por el mismo modelo de movimiento y que triangulación es capaz de ubicar una serie de marcado-
cada robot cuenta con un controlador de posición (x, y) res reflejantes montados en los robots y en el obstáculo.
mediante entradas de velocidad de traslación y rotación. La Figura 6 muestra algunas tomas del entorno con los
Uno de los robots, quien actúa como líder, conoce una robots moviéndose en formación. También se muestran
trayectoria de referencia, que es una secuencia de posi- algunas posiciones intermedias durante el seguimiento de
ciones deseadas para cada instante de tiempo. El resto la trayectoria, en particular durante la evasión del obs-
de robots del grupo inician en posiciones arbitrarias y táculo, lo cual causa que los 3 robots se desvíen para
el SMR debe realizar tres tareas: a) el robot líder debe después recuperar la trayectoria deseada.
converger a la trayectoria de referencia y seguirla hasta
que la misma termina; b) el resto de robots deben seguir
al líder en formación; c) cada uno de los robots del gru-
po, incluyendo el líder, debe evitar colisiones entre ellos
o con obstáculos fijos del entorno. Estas tareas se pueden
integrar en un esquema de control distribuido basado en
prioridades que calcula las velocidades de cada robot to- Líder

mando en cuenta la posición que le comunican los robots Seguidores

vecinos de acuerdo a la conectividad de la red de robots. Configuración inicial Siguiendo trayectoria circular

Seguidores
5 obstáculos Líder Obstáculo
Líder
Siguiendo
trayectoria Evasión de
circular obstáculo
Seguidores
Obstáculos

Figura 5. Configuración inicial de un grupo de 10 robots y


convergencia a la formación deseada.
Evasión de obstáculo Configuración final

Se ha evaluado en simulación un control de segui-


miento de trayectoria en formación utilizando el software
Gazebo con un grupo de 10 robots y 5 obstáculos circula-
res de diferentes radios, como se muestra en la imagen de Figura 6. Experimento de seguimiento en formación con
la izquierda en la Figura 5. Los robots inician alineados y tres robots y un obstáculo.
al ejecutar el control distribuido el líder empieza a seguir
una trayectoria en círculo y los demás alcanzan la forma-
ción deseada como se muestra en la imagen de la derecha
Control de formaciones basado en opti-
en la Figura 5. Se observa que el grupo de robots puede mización
lidiar con los obstáculos del entorno realizando evasiones La teoría de consenso también se puede utilizar en un
cuando es necesario; después de un periodo transitorio de esquema de control basado en optimización. Uno de los
la tarea de evasión, los robots regresan a su movimiento esquemas de control más populares que se basan en op-
de formación, ya que se utiliza un esquema multitareas timización es el Control Predictivo basado en Modelo [2]
(como el que se describió en la sección previa). (MPC, por sus siglas en inglés). Como su nombre lo in-
El esquema de control también se ha evaluado me- dica, el MPC requiere de una representación matemática
diante experimentos con un grupo de 3 robots reales, un del sistema (modelo) para simularlo a lo largo de un ho-
robot Pioneer 3DX que fungió como líder, dos Turtlebots rizonte de tiempo y predecir su evolución, para entonces
2 como seguidores y un obstáculo en el entorno. En es- corregir las desviaciones que se generen respecto a una
tos resultados, la formación deseada es un triángulo y el referencia de acuerdo a la solución de un problema de op-
grafo de comunicación considera que cada robot tiene co- timización en el que se quiere minimizar una función de
municación con los otros dos. Cada robot se conectó por costo. En esta sección se describe el control de formacio-
medio de WiFi a una computadora donde se calcularon nes de un grupo de cuadricópteros basado en MPC. Para
los comandos de velocidad de forma distribuida usando resolver este problema de forma distribuida se plantea en
el Sistema Operativo Robótico (ROS, por sus siglas en [8] un esquema donde el control para cada cuadricóptero
inglés). La posición de cada robot y del obstáculo se ob- se resuelve de forma independiente en una computadora
tuvieron mediante un sistema de captura de movimien- distinta de acuerdo a la Figura 7.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 71 / 88
posible manejar un periodo de muestreo de 0.1 segun-
dos por iteración. En la Figura 8 se presentan algunas
tomas de un experimento con un obstáculo en forma de
columna. Los cuadricópteros deben alcanzar una forma-
ción en triángulo. Desde la configuración inicial, el agente
C1 avanza evadiendo el obstáculo, mientras que C3 re-
trocede. El agente C2 se mantiene en el mismo lugar sin
Figura 7. Diagrama de control basado en MPC. control, con el objetivo de que actúe como una ancla pa-
ra la formación y que ésta se mantenga en el área de
Un modelo de integrador simple representa el mo- detección. En la última imagen se observa que los tres
vimiento en cada coordenada de posición (x, y, z ) y se cuadricópteros alcanzan la formación en triángulo.
usa como modelo predictivo. El esquema de control de
cada cuadricóptero recibe información de la posición y Configuración inicial
C2 C2

velocidad de los robots vecinos para calcular el valor de Obstáculo


consenso y usarlo como referencia del consenso estimado
por el modelo predictivo. La función de costo conside-
C3
C1 C1
ra un término de error de consenso y un término de las
C3

entradas de control, los cuales se desean minimizar a lo


largo de un horizonte de tiempo. Una gran ventaja del C1 C2 C2

MPC es la facilidad de introducir restricciones para la


C1

solución del problema de optimización, lo cual permite


Obstáculo Obstáculo

resolver varias tareas simultáneamente: a) lograr la for- C3

mación deseada; b) evitar colisiones entre agentes y con C3

obstáculos fijos en el entorno; c) mantener la conectivi- C1

dad de comunicación de acuerdo a lo especificado en la


C2 C1 C2

configuración inicial; y d) limitar las velocidades máxi- Obstáculo


mas a un rango específico. Las restricciones de evasión C3
y conectividad se pueden manejar de forma similar uti- Configuración final
C3

lizando la posición relativa (distancia) entre agentes o a


los obstáculos. Para la evasión, no debe ser menor a un Figura 8. Experimento de formación con evasión de obs-
valor predefinido; para la conectividad, no debe exceder táculos y mantenimiento de conectividad.
el alcance de la comunicación entre agentes.
Un esquema basado en MPC se ha evaluado en ex- Conclusiones
perimentos con un grupo de tres cuadricópteros Bebop El control de sistemas multi-robot es de gran utilidad
2 considerando lo siguiente. Cada cuadricóptero cuenta para diversas aplicaciones en las que un grupo de robots
con un control de velocidad interna que recibe como en- resuelven una tarea de forma más eficiente o que no es
trada la velocidad deseada generada por el control de posible resolver por un solo robot. En este trabajo se ilus-
alto nivel de formación basado en MPC. Cada uno de tra cómo el uso de la teoría de consenso en el control de
los agentes se comunica con los otros dos, enviando su sistemas multi-robot permite alcanzar formaciones pre-
posición, obtenida mediante un sistema de captura de viamente especificadas, donde cada uno de los robots se
movimiento, así como la velocidad calculada por el al- controla de forma distribuida únicamente mediante in-
goritmo MPC. El problema de optimización del MPC formación local. Se utiliza un esquema multi-tarea je-
se resuelve de manera distribuida en una computadora rárquico para alcanzar una formación y evitar colisiones
independiente para cada agente. Esto se realiza debido entre robots o con objetos del entorno. Extendiendo el
a que el poder de cómputo sobre los cuadricópteros es uso de la teoría de consenso, se muestran resultados de
limitado, por lo que se envían los comandos de veloci- seguimiento de un líder. Con el objetivo de facilitar la
dad calculados en las computadoras vía WiFi y usando introducción de otras restricciones, como mantener la co-
el driver de ROS bebop_autonomy. Cada computadora nectividad del grafo de comunicación mientras se evitan
resuelve un problema de optimización que se expresa de colisiones, se utiliza la teoría de consenso en combinación
forma cuadrática para garantizar la existencia de una con control predictivo basado en modelo.
solución. En los esquemas basados en MPC es importan- Como trabajo a futuro se considera el control de
te el parámetro referente al horizonte de predicción, un formaciones flexibles para la navegación en espacios re-
valor grande resulta en un mejor desempeño pero se in- ducidos con evasión de obstáculos irregulares, así como
crementa el costo computacional. Experimentalmente se lograr la formación cuando el grafo de comunicación va-
determinó un horizonte de 15 iteraciones, con lo que fue ría de manera dinámica, y así relajar la condición de

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 72 / 88
que el grafo de comunicación deba ser conectado en todo 4. Martinez, J.B., Becerra, H.M., y Gómez-Gutiérrez, D. (2021).
momento. También se está trabajando en el desarrollo Formation tracking control and obstacle avoidance of unicycle-
type robots guaranteeing continuous velocities. Sensors, 21(13),
de algoritmos para lograr la formación especificada cum- 4374.
pliendo con restricciones de tiempo.✵
5. Mesbahi, M., y Egerstedt, M. (2010). Graph Theoretic Methods
in Multiagent Networks. Princeton Series in Applied Mathema-
tics.
REFERENCIAS
1. Antonelli, G., Arrichielo, F., y Chiaverini, S. (2009). Expe- 6. Oh, K.K., Park, M.C., y Ahn, H.S. (2015). A survey of multi-
riments of formation control with multirobot systems using agent formation control. Automatica, 53, 424-440.
the null-space-based behavioral control. IEEE Transactions on
Control Systems Technology, 17(5), 1173- 1182. 7. Trujillo, M.A., Becerra, H.M., Gómez-Gutiérrez, D., y Ruiz-
2. Camacho, E., Bordons, C., y Alba, C. (2004). Model Predictive León, J. (2021). Hierarchical task-based formation control and
Control. Advanced Textbooks in Control and Signal Processing. collision avoidance of UAVs in finite time. European Journal of
Springer London. Control, 60, 48-64.
3. Kamel, M.A., Yu, X., y Zhang, Y. (2020). Formation control and 8. Vargas, S., Becerra, H.M., y Hayet, J.B. (2022). MPC-based
coordination of multiple unmanned ground vehicles in normal distributed formation control of multiple quadcopters with obs-
and faulty situations: A review. Annual Reviews in Control, tacle avoidance and connectivity maintenance. Control Engi-
49, 128-144. neering Practice, 121, 105054.

SOBRE LOS AUTORES

Héctor M. Becerra obtuvo el grado de doctor en Ing. de Sistemas e Informática por la U. de Zaragoza,
España en 2011. Actualmente labora como investigador en el Centro de Investigación en Matemáticas,
CIMAT-Guanajuato y es miembro del Sistema Nacional de Investigadores Nivel I. Sus intereses de
investigación incluyen aplicaciones de teoría de control en robótica, para robots de ruedas, humanoides
y vehículos aéreos, así como el control de sistemas de múltiples agentes.

Miguel Angel Trujillo Jacobo obtuvo el grado de doctor en en Ciencias en Ingeniería Eléctrica en
CINVESTAV, Unidad Guadalajara en 2021. Actualmente es profesor del Tecnológico de Monterrey,
Campus Zapopan. Sus intereses científicos incluyen el control de sistemas multi-agente y navegación
de sistemas multi-robot en espacios estrechos.

David Gómez Gutiérrez obtuvo el grado de doctor en Ciencias en Ingeniería Eléctrica en Cinvestav,
Unidad Guadalajara en 2013. Es investigador en robótica en Intel Labs, Intel Corporation, miembro del
Instituto Tecnológico José Mario Molina Pasquel y Henríquez, Unidad Académica Zapopan y miem-
bro del Sistema Nacional de Investigadores Nivel II. Sus intereses científicos incluyen la navegación
autónoma de robots, los sistemas multi-agentes y el control robusto.

Javier Ruiz León obtuvo el grado de doctor en Ciencias en Ingeniería Eléctrica en la Universidad
Técnica Checa, Praga, República Checa en 1996. Actualmente es Profesor-Investigador en la Unidad
Guadalajara del CINVESTAV y es miembro del Sistema Nacional de Investigadores Nivel I. Sus princi-
pales intereses de investigación son teoría de sistemas lineales, sistemas híbridos y control y formación
de sistemas multi-agentes.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 73 / 88
ARTÍCULO ACEPTADO
Cómo contar personas usando WiFi y ML
Ramón F. Brena, Edgar Escudero, César Vargas Rosales, Carlos E. Galván Tejada y David Muñoz
Introducción tiene que portar un dispositivo electrónico. Obviamente
La información de cuántas personas se encuentran en un en estos casos se tiene que detectar la presencia de una
espacio físico (como por ejemplo el recibidor en un centro persona en sí, no un dispositivo que lleva consigo.
de congresos, o el área de comida en un centro comercial) En años recientes, se han desarrollado métodos que
es de mucha relevancia tanto por razones de seguridad analizan las perturbaciones que el cuerpo humano pro-
de la gente (por ejemplo, por el impacto de dicha can- duce entre la transmisión y recepción de señales de WiFi.
tidad en la posibilidad de contagio de COVID o por la Estos métodos pueden ser convenientes para aplicaciones
posibilidad de una evacuación de emergencia) como por de conteo de gente dada la amplia disponibilidad de seña-
el potencial para ventas y mercadotecnia, o para la re- les WiFi en entornos urbanos y el bajo costo asociado a
gulación de la climatización, y otras aplicaciones. estos equipos, por las economías de escala que brinda su
Se han aplicado métodos muy diversos para dimen- popularidad [2]. Dichos trabajos presentan limitaciones
sionar el tamaño de un grupo de personas, varios de ellos en cuanto a la exactitud, y el objetivo de nuestro traba-
basados en hacer interaccionar un equipo fijo en el lugar jo, cuyos detalles fueron publicados por Brena et al. [3],
con los dispositivos móviles que portan muchos usuarios es mejorar dicha exactitud. Esto lo hacemos desglosando
consigo [1]; en la sección de antecedentes haremos una re- con mayor detalle las caracterísitcas de la comunicación,
visión más detallada de ellos, pero en términos generales como explicaremos más adelante. Los beneficios que pre-
es deseable que el conteo de personas no dependa de que senta nuestro método son las siguientes:
carguen o no un dispositivo electrónico, pues hay situa-
ciones en que esto no es viable (por ejemplo, en una playa 1. Se requiere un número menor de características de
o piscina), además de que la proporción de gente con el las señales que en trabajos comparables,
celular consigo –con los puertos de conexión abiertos–
presenta una gran variabilidad, sobre todo para grupos 2. Nuestro método funciona en equipos comerciales
reducidos de gente. Adicionalmente está el problema de de WiFi (no se requiere equipo de laboratorio es-
la privacidad, pues al recabar información de los equipos pecializado),
portables detectados se pueden conocer los hábitos de
una persona, por ejemplo, con qué frecuencia visita un 3. Obtenemos una mejor exactitud, así como otras
lugar y qué otros individuos coinciden en éste. Por ello medidas de rendimiento experimental, que en los
se ha buscado crear métodos pasivos en que el usuario no trabajos de otros investigadores.

Se han desarrollado métodos que analizan las perturbaciones que el cuerpo


humano produce entre la transmisión y recepción de señales de WiFi.
Antecedentes La detección de personas en un lugar en particular
La caracterización de los grupos o multitudes de seres se hace frecuentemente mediante la detección de la se-
humanos ha sido el objeto de estudio de muchas investi- ñal celular, o bien la IP de equipos portátiles que tratan
gaciones, y dicha caracterización no se limita al conteo, de conectarse a WiFi o Bluetooth. Sobra decir que estos
pues también se ha buscado encontrar características ta- últimos dos enfoques suponen que el usuario del celular
les como los patrones de movilidad, como son: qué tan tiene abierta la conexión WiFi y/o Bluetooth.
rápido se mueven las personas, o bien si lo hacen en la Por ello tenemos interés en usar los métodos pasivos,
misma dirección o en forma aleatoria [4], lo que puede entre los que encontramos trabajos de visión computacio-
tener mucho impacto para detectar emergencias u otros nal, tanto recientes como de hace décadas [5], en los que
aspectos de la seguridad. Por ejemplo, si hay un incendio una o varias cámaras apuntadas hacia la multitud en-
o un disparo, las personas van a tender a moverse rápido vían la imagen a un sistema computacional de análisis,
alejándose del peligro. Las multitudes se han estudiado el cual hace la estimación de la cantidad de individuos
con herramientas tales como dinámica de fluidos y de por métodos que no vamos a discutir aquí. Sin embar-
muchas otras formas. En este artículo nos limitamos al go, los métodos de visión computacional sufren de pro-
conteo de un grupo de humanos. blemas de oclusión (personas no visibles porque no hay

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 74 / 88
línea directa de vista entre ellas y la cámara), así como sido usada como base para conteo de personas, como en
de iluminación o la falta de ella. el trabajo de Yoshida [7], pues la presencia de personas
En este contexto, los métodos de cuantificación de entre el transmisor y el receptor atenúa la señal, lo que
grupos basados en el análisis de perturbaciones de la se- puede ser analizado. Yoshida alcanza un 77 % de exacti-
ñal de WiFi causadas por la presencia del cuerpo hu- tud en la predicción del conteo para grupos de hasta 7
mano entre el transmisor y el receptor son de mucho personas. Un problema de los métodos de RSSI es que
interés, pues en primer lugar son completamente pasivos suponen un entorno libre de otros obstáculos dispersores
(el usuario no tiene que llevar ningún dispositivo), con el de señal más que las personas que se quiere detectar, lo
consiguiente mejoramiento de la privacidad para el indi- cual dificulta mucho su aplicación práctica.
viduo [6]. Cabe aclarar que estos métodos no requieren Alternativamente al RSSI, otros trabajos más recien-
que la persona se encuentre exactamente entre el trans- tes utilizan el “Channel State Information” (CSI) [8], que
misor y el receptor de WiFi. La idea de usar WiFi es provee información de la respuesta de un canal en un sis-
natural debido a la alta disponibilidad de equipos para tema de comunicación WiFi con varias antenas de trans-
propósitos de conexión de usuarios al internet. misión y varias de recepción, llamados “MIMO” (“Mul-
tiple Input, Multiple Output”). La información de CSI,
incluye dispersión, atenuación y trayectorias múltiples
entre transmisor y receptor, y por lo tanto tiene una
granularidad mucho más fina que la fuerza de la señal
dada por el RSSI. El trabajo de Di Domenico [9] hace
uso de la información de CSI, y es comunmente usado
como indicador del estado del arte; tiene una exactitud
de un 80 % para contar grupos de hasta 7 personas y fue
el punto de inicio del presente trabajo.
Figura 1. Efecto Doppler producido por dispersores en mo- El método que utilizamos en este artículo hace uso,
vimiento en una liga WiFi. para la extracción de características de la señal usadas
en el dataset, de una transformación de la información
Ahora bien, esta idea general de analizar las pertur- temporal de la señal hacia lo que se llama espectro de
baciones al campo de señal de WiFi para contar personas Doppler [9], pues esta transformación permite identifi-
ha sido realizada de varias formas, que vamos a presentar car objetos con movimiento (como es generalmente una
a continuación. Los trabajos que han encontrado mejores persona) y diferenciarlos de otros objetos dispersores de
resultados no usan métodos analíticos (esto es, basados la señal, como pueden ser muebles u otros obstáculos en-
en un modelo matemático previamente desarrollado) sino tre el transmisor y el receptor. El uso de características
que utilizan aprendizaje automático (ML, por sus siglas en el espectro de Doppler mejora la exactitud del conteo
en inglés) supervisado. El lector puede consultar las ba- de personas, y potencialmente podría permitir el análisis
ses de ML en múltiples libros de texto). En ML se entrena del desplazamiento de la multitud, aunque esto (explora-
un modelo general preestablecido, como por ejemplo ár- do en el trabajo de Depatla [6]) queda fuera del alcance
boles de decisión, KNN, Random Forest, Support Vector de este artículo.
Machines, etc., con muestras de un conjunto de datos Los sistemas WiFi modernos utilizan múltiples ante-
(“dataset”) previamente clasificadas; por esto se llama nas, tanto en el emisor como en el receptor, para mejorar
ML supervisado. Luego se prueba el modelo en muestras las capacidades de transmisión, y tienen múltiples salidas
que no fueron incluidas en el entrenamiento para ver qué y entradas (MIMO, por las siglas en inglés). En contraste
tan bien puede el sistema clasificar muestras no vistas. con los sistemas con una sola antena en el transmisor y
WiFi es el nombre comercial del estándar IEEE otra en el receptor (SISO: por las siglas en inglés), los sis-
802.11 (con las muchas variantes que ha tenido en su temas MIMO pueden llevar simultáneamente varias se-
evolución desde 1997), y es actualmente el estándar do- ñales conteniendo información. En el lado receptor de
minante para comunicaciones inalámbricas en áreas limi- estos sistemas, se usan varias ténicas de decodificación,
tadas (WLAN, por sus siglas en inglés), y opera en las enfoque de la señal, detección de símbolos, que resultan
bandas de 2.4 y 5GHz. Uno de los aspectos de la señal en grandes mejoras en eficiencia en el uso del espectro,
de WiFi que han sido más utilizados es la información de cantidad de datos transmitidos y recibidos. Suponiendo
intensidad de señal (RSSI por Received Signal Strength que un sistema MIMO tiene 3 antenas de transmisión y
Indicator ), principalmente por la facilidad para obtener- ×
el receptor tiene 2, decimos que es un sistema 3 2 MI-
la. RSSI ha sido ampliamente usada para métodos de MO con 6 canales de comunicación (el producto de los
localización en interiores de edificios, donde la señal de puntos de salida por los de entrada).
GPS es atenuada o bien no es disponible debido a múlti- Ahora estamos en condiciones de explicar cuál es la
ples obstrucciones dentro de un edificio. RSSI también ha contribuión específica de este trabajo. Aunque hay otros

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 75 / 88
trabajos, como el de Di Domenico [9] que usan la infor- 1. Estimación del espectro Doppler: una rutina en
mación de CSI en un sistema MIMO con uso del espectro MATLAB obtiene para cada renglón del dataset
de Doppler, ellos tomaron algunas decisiones en cuanto parámetros del espectro Doppler (ver detalles ma-
a la extracción de características que no nos parecieron temáticos en Brena et al. [3]),
completamente justificadas, como usar el promedio de
canales, tal vez considerando que la información indivi- 2. Extracción de características: a partir de las lectu-
dual de cada canal contiene mucho ruido, hipótesis que ras de CSI y los parámetros del espectro Doppler,
nosotros cuestionamos en nuestro trabajo. Asimismo, se obtiene un vector de características que inclu-
ellos utilizan el clasificador Naive Bayes, tal vez por su yen varios indicadores estadísticos de la señal. Ca-
simplicidad, pero nosotros consideramos que hay mu- da uno de estos vectores va a ser un renglón del
chas situaciones en que Naive Bayes queda lejos de ser el nuevo dataset que nosotros elaboramos.
clasificador más indicado en términos de exactitud. Lo
anterior no quiere decir que el trabajo de Di Domenico 3. Partición del dataset en una parte para entrena-
sea el único en usar ML sobre CSI de WiFi para conteo miento y otra de prueba para el cálculo de la exac-
de personas, pues también están trabajos como el de Xi titud.
et al. [10]. Sin embargo, fue en relación al trabajo de 4. Entrenamiento del clasificador: Usando la partición
Di Domenico que encontramos más áreas de oportuni- de entrenamiento, ajustamos por un proceso están-
dad, además de que Di Domenico publicó un dataset dar de ML los parámetros del modelo.
abierto que pudimos utilizar nosotros, lo que brinda la
oportunidad de comparar directamente el rendimiento 5. Evaluación de las predicciones: Una vez entrena-
de cada método. En la tabla 1 presentamos los trabajos do el clasificador, con el mismo se predice un valor
más representativos del estado del arte y su rendimiento para cada uno de los renglones de la partición de
en términos de exactitud (“accuracy”). prueba. La calidad de la predicción es la medida
del parecido que tienen las predicciones del clasifi-
Tabla 1. Principales trabajos de conteo de personas usando cador con el valor real, pero esto se puede hacer de
WiFi. muchas formas (precisión, exactitud, sensitividad
y otras medidas), dependiendo de lo que se quie-
re enfatizar. Nosotros utilizamos principalmente la
exactitud, que es el cociente entre los aciertos en
la predicción y el número de datos.
A partir del conjunto de datos de 4040 renglones que
usamos hasta la evaluación de la exactitud, todo se pue-
de considerar como un proceso estándar de ML, por lo
Método propuesto que no pretendemos haber hecho ninguna contribución
Nuestro método está basado en la hipótesis de que la en ese terreno. Nuestra contribución es el proceso que va
diversidad en los múltiples canales de comunicación pue- desde la extracción de características a partir de las lec-
de aportar información útil para identificar patrones de turas de instrumentos proveídas por el conjunto de datos
dispersión de señal que permitan contar personas en el de Di Domenico a la construcción del nuestro, así como
espacio entre transmisor y receptor, en vez de considerar la selección y configuración del clasificador adecuado.
dicha variedad como ruido. Así, mientras otros autores
promedian la información de los canales en un esfuerzo
por mejorar la relación señal-ruido, nosotros explotamos
la diversidad en los canales para obtener características
de más detalle. Pusimos un gran esfuerzo en refinar un
grupo de características que pudieran mejorar el rendi-
miento del proceso de ML en términos de exactitud (esto
se conoce como “feature Engineering”), y también ensa-
yamos distintos métodos de clasificación para mejorar el
rendimiento tanto como pudiéramos.
Realizamos nuestro proceso de ML usando usando
el sistema MATLAB, que ofrece un conjunto variado de
métodos de clasificación.
Nuestro proceso, enteramente guiado por los datos, e Figura 2. Diagrama de nuestro proceso de datos.
ilustrado en la Figura 2, comprende las etapas siguientes:
© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691
Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 76 / 88

Nuestro método funciona en equipos comerciales de WiFi (no se requiere


equipo de laboratorio especializado).
Resultados solo canal hasta 1 (redondeado en las centésimas) con los
Nuestro entorno experimental se configuró en torno al 6 canales. Puede verse que la mejora marginal al pasar
ambiente MATLAB, que nos facilitó mucho nuestro aná- de uno a dos canales es mucho mayor que la de pasar de
lisis empírico al incluir bibliotecas para muchas de las 5 a 6 canales, lo que era de esperarse.
tareas de ML, inluyendo los clasificadores que usamos.
Otros cálculos, como los relacionados con el uso del es-
pectro de Doppler, fueron programados por nosotros en
el lenguaje ofrecido por MATLAB.
Partimos del dataset de Di Domenico [9], que inclu-
ye desde lecturas instrumentales hasta información de-
rivada, como las características que fueron usadas en el
proceso de ML. Este dataset incluye información de 3
lugares o cuartos, nombrados “A”, “B” y “C”.
En la Tabla 2 presentamos los resultados de los cla-
sificadores usando solamente promedios de los canales
para el cuarto A, mientras que en la Tabla 3 viene lo Figura 3. Exactitud al ir aumentando canales.
mismo usando la información de los canales individuales.
Tabla 2. Exactitud con promedios de canales. Al considerar todos los cuartos (A, B y C) los resulta-
dos no son perfectos para todos los clasificadores, como
se puede ver en la Tabla 4, pero en realidad mientras
haya algún clasificdor con el cual los resultados son muy
buenos, esto indica que ese es el clasificador que hay que
usar; no tienen que ser buenos los resultados con todos
los clasificadores.
Tabla 3. Exactitud con canales individuales. Tabla 4. Exactitud en cada uno de los 3 cuartos usando varios
canales.

Comparando la Tabla 2 con la Tabla 3 se puede ver


(en la columna de pruebas al extremo derecho) que la
exactitud sube apreciablemente al usar la información de Finalmente, en la Tabla 5 se puede ver que usando
los canales individuales, llegando a una clasificación per- únicamente 6 características (una por canal) es posible
fecta del 100 % en escenarios con hasta 8 personas; esto obtener, para al menos un clasificador (el SMV Gau-
es, el sistema es capaz de predecir exactamente cuántas siano) en el cuarto A una exactitud perfecta; también
personas hay en el cuarto A sin error alguno, mientras se obtiene 100 % usando más características, pero eso es
que usando el promedio de los canales, como hacía Di menos efiiciente computacionalmente.
Domenico y otros, hay algunos errores. Esto es evidencia
a favor de nuestra hipótesis de que es importante incluir Tabla 5. Exactitud usando distintos métodos de selección de
la información de CSI de los canales individuales, en vez características.
de usar uno de ellos o el promedio.
Particularmente ilustrativos son los resultados de la
gráfica presentada en la Figura 3, donde se muestra el
efecto sobre la exactitud de ir añadiendo uno por uno los
6 canales en el cuarto A; puede verse una curva aproxi-
madamente logarítmica que empieza desde 0.44 con un
© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691
Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 77 / 88

Es deseable que el conteo de personas no dependa de que carguen o no un


dispositivo electrónico.
Conclusiones 2. Yuan, Y., Zhao, J., Qiu, C. y Xi, W. (2013). Estimating crowd
density in an RF-based dynamic environment. IEEE Sensors
En el artículo de Brena et al. [3], del que el presente es un Journal, 13(10), 3837-3845.
resumen de divulgación, se presenta un método mejorado
para contar personas en un espacio entre el transmisor 3. Brena, R.F., Escudero, E., Vargas-Rosales, C., Galvan-Tejada,
C. E. y Munoz, D. (2021). Device-Free Crowd Counting Using
y el receptor de WiFi multicanal (MIMO). Esto se hace Multi-Link Wi-Fi CSI Descriptors in Doppler Spectrum. Elec-
reconociendo patrones de la información de estado de los tronics, 10(315), 1-25.
canales (CSI) sobre múltiples canales en el espectro de 4. Pathan, S.S., Al-Hamadi, A. y Michaelis, B. (2010). Incorpora-
Doppler, en vez de utilizar un canal o el promedio de la ting social entropy for crowd behavior detection using SVM. En
información de los canales. Así confirmamos experimen- International Symposium on Visual Computing proceedings,
153-162.
talmente nuestra hipótesis de que la información de los
canales individuales podría conducir a mejores resulta- 5. Wang, C., Zhang, H., Yang, L., Liu, S. y Cao, X. (2015). Deep
people counting in extremely dense crowds. En Proceedings of
dos en términos de exactitud en la predicción del número the 23rd ACM international conference on Multimedia, 1299-
de personas en un espacio dado. 1302.
Nuestro método usa un proceso estándar guiado por 6. Depatla, S., Muralidharan, A. y Mostofi, Y. (2015). Occupancy
los datos de aprendizaje supervisado, en que se constru- estimation using only WiFi power measurements. IEEE Jour-
ye un conjunto de datos con un renglón para cada dato, nal on Selected Areas in Communications, 33(7), 1381-1393.
y una columna para cada característica considerada. La 7. Yoshida, T. y Taniguchi, Y. (2015). Estimating the number of
determinación de las características es otra de nuestras people using existing WiFi access point in indoor environment.
En Proceedings of the 6th European Conference in Computer
contribuciones, pues mostramos cómo utilizando tan solo Science (ECCS), 46-53.
una característica por canal en el espectro de Doppler fue
posible predecir perfectamente la cantidad de personas 8. Ma, Y., Zhou, G. y Wang, S. (2019). WiFi sensing with chan-
nel state information: A survey. ACM Computing Surveys
en grupos de hasta 8 personas. (CSUR),52(3), 1-36.
Nosotros usamos equipo estándar no especializado, 9. Di Domenico, S., Pecoraro, G., Cianca, E. y De Sanctis, M.
características de todos los canales, un clasificador de ti- (2016). Trained-once device-free crowd counting and occupancy
po SVM Gausiano, y la exactitud es de 1 redondeando estimation using WiFi: A Doppler spectrum based approach.
En Proceedings of the IEEE 12th International Conference
centésimas para hasta 8 personas.✵ on Wireless and Mobile Computing, Networking and Com-
munications (WiMob), 1-8.
REFERENCIAS 10. Xi, W., Zhao, J., Li, X. Y., Zhao, K., Tang, S., Liu, X. Jiang,
1. Joglekar, P. y Kulkarni, V. (2016). Mobile crowd sensing for Z. (2014). Electronic frog eye: Counting crowd using WiFi.
urban computing. International Journal of Latest Trends in En IEEE Conference on Computer Communications (INFO-
Engineering and Technology, 7(4), 344-351. COM), 361-369.

SOBRE LOS AUTORES


Ramón F. Brena P. obtuvo el doctorado en Informática, especialidad Inteligencia Artificial en el
Instituto Nacional Politécnico de Grenoble, Francia. Ha trabajado como profesor e investigador en el
ITAM, el Tecnológico de Monterrey y actualmente el Instituto Tecnológico de Sonora, con estancias
en la U.T. en Dallas y la U. de Montreal. Es miembro del Sistema Nacional de Investigadores y de la
Academia Mexicana de Ciencias. Sus intereses de investigación incluyen el uso del contexto en IA, los
agentes inteligentes y el aprendizaje automático.

Edgar Escudero R. obtuvo su grado de Maestría en Communicaciones Inalámbricas en la Univer-


sidad de Leeds, Reino Unido, donde obtuvo el premio IEEE al mejor trabajo de investigación. Tiene
además un MBA por la EGADE del Tecnológico de Monterrey y es graduado del Programa de Tecno-
logía y Aceleración de Innovación del MIT. Es co-fundador de varias start-ups basadas en tecnología
en las que desarrolla proyectos de automatización, optimización y modelos de inteligencia artificial

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 78 / 88
Cesar Vargas-Rosales obtuvo el grado de doctor en Ingeniería Eléctrica de Louisiana State University
en 1996. Actualmente es profesor investigador y líder del grupo de investigación en telecomunicacio-
nes del Tecnológico de Monterrey. El Dr. Vargas es miembro del Sistema Nacional de Investigadores
Nivel II, de la Academia Mexicana de Ciencias, de la Academia de Ingeniería de México y miembro
Senior de IEEE. Sus intereses de investigación incluyen localización, 5G, MIMO, codificación y modelos
estocásticos.
Carlos E. Galván Tejada recibió el título de Ingeniero en Computación y el grado de Maestro en
Ingeniería por la Universidad Autónoma de Zacatecas. Doctor en Tecnologías de la Información y
Comunicaciones con especialidad en Inteligencia Ambiental en el Tecnológico de Monterrey campus
Monterrey. Sus intereses de investigación incluyen Inteligencia ambiental, Procesamiento de señales,
Cómputo sensible al contexto, Bioinformática y Desarrollo de videojuegos. Pertenece al Sistema Na-
cional de Investigadores (SNI 2).

David Muñoz obtuvo el doctorado en le Universidad de Essex , Inglaterra. Ha trabajado como


profesor e investigador en el Cinvestav, el Tecnológico de Monterrey y en la Universidad de Texas en
Dallas y el Instituto Politécnico Nacional. Es miembro del Sistema Nacional de Investigadores. Sus
intereses de investigación incluyen analisis de desempeño en sistemas de telecomunicaciones y sistemas
de localización.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 79 / 88
ARTÍCULO ACEPTADO
Un paseo por el análisis de señales con wavelets y
redes neuronales
Oscar Herrera Alcántara
El concepto de frecuencia en el análisis de tanto, contiene 4 frecuencias distintas: f, 2f, 4f, y 8f que
señales es su espectro de frecuencia. Por simplicidad, se puede
Seguramente, al escuchar la palabra “frecuencia” la aso- asumir que cada componente frecuencial tiene la misma
ciamos a la cantidad con la que sucede algún evento. amplitud igual a 1/2 como se ilustra en la Figura 2a,
En efecto, una primera acepción de frecuencia es en el en donde cada componente concentra un porcentaje de
contexto de la probabilidad y la estadística. Una segun- su energía. El total de la energía de la señal se define
da acepción del término frecuencia es en el contexto del como la suma del cuadrado de cada componente en el
análisis de señales. Señales como valores que cambian espectro de frecuencia, y en el caso anterior cada compo-
con el tiempo: series de tiempo. Por ejemplo, una se- nente tendría 1/4 como fracción de energía (ver Figura
ñal de audio o una señal visual de imagen de la cámara 2b) y como hay 4 valores en frecuencia, la energía es 4
de un teléfono celular. Recientemente, después del “apa- veces un cuarto (el cuadrado de un medio) que es, cier-
gón analógico en México”, la señal de televisión abier- tamente, la unidad o sea la señal tendría el 100 % de su
ta sólo usa transmisión digital. En una señal analógica energía distribuida uniformemente en todas sus frecuen-
se tiene un conjunto infinito de valores. Al digitalizar cias. El Teorema de Parseval [1] indica que la energía en
una señal analógica, los valores continuos se expresan el espacio temporal es igual a la energía en el espacio
con un conjunto finito, pero suficientemente grande pa- frecuencial. Para comparar dos señales se puede hacer
ra no perder detalle perceptual. Si es audio, que se si- comparando sus valores en el dominio temporal, es decir
ga oyendo con razonable calidad y si es imagen, que se los valores en cada instante si es que es una señal analó-
pueda ver sin degradación aparente. Entonces, la señal gica o en intervalos determinados en el caso de una señal
digital podrá procesarse, transmitirse y reproducirse sin digital.
distinción respecto a una señal analógica. Inclusive, se
pueden tener más beneficios al aplicar técnicas de pro-
cesamiento digital de señales para eliminar ruidos. La
frecuencia se mide en Hertz y se refiera al número de ci-
clos de un evento en cada segundo, como se ilustra en la
Figura 1 (véase además http://www.sc.ehu.es/sbweb/
fisica3/oscilaciones/mas/mas.html). Las señales so-
noras, por ejemplo, son captadas por el oído humano en
un rango estimado de 20 a 20000 Hz. Las frecuencias por
encima de 20000 Hz no las oímos y sólo algunos animales,
como los perros, pueden escucharlos.
Figura 2. a) El espectro de frecuencia de una señal con 4
frecuencias distintas con la misma amplitud. b) Distribución
uniforme de energía de esa señal.
También podemos hacerlo comparando sus valores en
los espectros de frecuencia. En ambos casos, se resta ca-
da valor y si son iguales, la diferencia será cero. Otra
Figura 1. La velocidad a la que el punto se mueve sobre la manera de comparar dos señales es mediante una mul-
circunferencia y cierra el ciclo de 360º define la frecuencia de tiplicación seguida de una suma, siempre que la energía
una señal senoidal. sea unitaria, como en el caso de ejemplo. Si cada ampli-
tud es 1/2, 1/2, 1/2, 1/2, al multiplicarla por sí misma se
Un método para analizar señales es con un espectro obtiene 1/4, 1/4, 1/4, 1/4 y luego al sumar se tienen 4/4
de frecuencias. Supóngase que una señal tiene una fre- que significa el 100 % de similitud consigo misma. O sea
cuencia de 1 Hz y que cada segundo duplica su frecuencia que en lugar de restar es posible multiplicar y sumar pa-
hasta llegar a 8 veces su frecuencia fundamental f. Por ra obtener un porcentaje de similitud (ver Figura 3). En

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 80 / 88
general, dadas dos señales con energía unitaria, se puede señal de referencia que oscila a frecuencia fija (ver Figura
comprobar que la única manera de obtener el 100 % de 4). Nótese que es complicado hacerlas coincidir, ya que
similitud es cuando son iguales. A continuación, se hace solo empatarían en una región.
esto con la señal anterior y otra con valores 1,0, 0, 0. Si
se multiplica cada valor de 1/2, 1/2, 1/2, 1/2 con 1, 0, 0,
0 y se suma, produce 1/2 o sea una similitud del 50 %.
Por otro lado, si se compara la señal 1, 0, 0, 0 consigo
misma se obtiene el 100 % de similitud.

Figura 4. Señal objetivo por analizar (arriba) y señal senoi-


dal como referencia (abajo).
Se pueden construir ventanas de análisis, donde se
tenga una señal senoidal con la duración de la ventana,
luego mover la ventana e ir cambiando la frecuencia. A
este concepto se le llama la convolución con ventana, o
transformada de ventana de Fourier [2].
Una manera ilustrativa de apreciar cómo hacer un
análisis de una señal desconocida, a partir de señales co-
nocidas, es imaginar que si las comparamos y encontra-
mos un lugar que empaten, podemos guardar esa infor-
mación y restar la señal conocida de la original, luego
Figura 3. Multiplicación de una señal digital por sí misma. repetimos el proceso y así podemos obtener una descom-
Una similitud de 100 % indica que son idénticas. posición iterativa de una señal con sus componentes de
un conjunto conocido. Se puede hacer un diagrama bi-
Las operaciones de multiplicar y sumar realizadas an- dimensional con un eje temporal combinado con un eje
teriormente para comparar señales forman parte de una de frecuencia para complementar el espectro frecuencial,
operación más completa llamada convolución. Con una porque este último sólo indicaría la presencia de una se-
convolución se obtiene la comparación de una señal con ñal de cierta frecuencia, pero no indicaría su duración, es
respecto al desplazamiento de otra, en el caso de las dos decir, no hacerlo asumiría que la señal a analizar contie-
señales 1/2, 1/2, 1/2, 1/2 y 1, 0, 0, 0 se tienen 7 despla- ne varias componentes oscilando a frecuencia fija durante
zamientos posibles con traslapes. La convolución puede todo el tiempo. ¿Cómo ilustrar esto? Imagínese que un
realizarse con señales analógicas o digitales. profesor de música pretende que sus alumnos toquen una
Hasta ahora, se han abordado varios conceptos co- melodía con diferentes instrumentos, pero omite indicar
mo frecuencia, energía, similitud, espectro frecuencial y en qué momento debe tocar y guardar silencio cada uno,
convolución. Todos estos son muy importantes en el aná- y por ende todos tocan simultáneamente durante toda la
lisis de señales ya que permiten obtener información para clase. Seguramente se oirá algo distinto a cualquier me-
compararlas. ¿Y por qué es importante comparar seña- lodía agradable. Por tanto, conviene establecer cuándo,
les? Como humanidad procuramos comparar algo des- por cuánto tiempo, con qué intensidad y qué nota debe
conocido con lo conocido, para llegar a comprenderlo, y tocar cada estudiante de la clase de música. En efecto, da
a esto se le llama análisis. Analizamos algo cuando lo lugar a un pentagrama. En un pentagrama se visualiza el
vemos. Recordemos la primera vez que vimos un objeto tiempo en el eje horizontal y la frecuencia de la nota en
desconocido, quizá un animal o una planta, seguramente el eje vertical, y en ese mapa de tiempo-frecuencia se ubi-
en forma “automática” lo primero que hizo nuestro ce- can las diferentes notas como componentes frecuenciales.
rebro fue un análisis que nos condujo a pensar “no es Este mismo concepto de pentagrama musical puede utili-
igual. . . pero se parece” y esto da pauta a pensar que zarse con las ventanas de análisis para comparar señales,
nuestro cerebro realiza un método de comparación ¿será no solo de audio. Sería como comparar dos pentagramas
acaso algún tipo de convolución? para ver que tanto se parecen las melodías.
Considérese ahora una señal objetivo que cambia su La Figura 5 ilustra la descomposición de una señal
frecuencia cada cierto tiempo y que se compara con una con ventanas ubicadas en tiempo y frecuencia.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 81 / 88

La convolución es una operación fundamental del análisis de señales, y es


parte fundamental del análisis con wavelets y en redes neuronales
artificiales.
en tanto que el filtro para bajas frecuencias de Haar
esL = (1/2, 1/2). Veamos cómo se aplica la transformada
wavelet de Haar a la señal 7, 5 , 3, 1. Al usar H se obtiene
(7, 5)x(1/2, −1/2) = 1; (3, 1)x(1/2, −1/2) = 1; y al usar
L se obtiene (7, 5)x(1/2, 1/2) = 6; (3, 1)x(1/2, 1/2) = 2.
Luego se aplica el cambio de escala a la mitad de la fre-
cuencia en donde la nueva señal es (6, 2, 1, 1), pero solo
se aplica a la parte de baja frecuencia, es decir a (6,
2). Nuevamente, con H y L se obtiene respectivamente
(6, 2)x(1/2, −1/2) = 2; (6, 2)x(1/2, 1/2) = 4. Estos re-
sultados se acomodan para obtener bandas de frecuencia
LL, LH y H , en donde la primera L en LL y LH indica
la aplicación previa del filtro L, seguida de otros filtrados
L y H . La ilustración se muestra en la Figura 6 con el
resultado 4, 2, 1, 1. La más baja frecuencia es LL = 4,
que corresponde al promedio de la señal completa, se-
guido de una aproximación con wavelet Haar LH = 2, y
una componente de wavelet Haar de más alta frecuencia
H = 1, 1 que tiene dos valores idénticos unitarios. La
reconstrucción es simple: 4 + 2 + 1 = 7; 4 + 2 − 1 = 5;
4 − 2 + 1 = 3; 4 − 2 − 1 = 1, y esto se ilustra en la Figura
6, en donde al combinar las componentes wavelet Haar
Figura 5. Espacio tiempo-frecuencia de una señal con ven- en color naranja y azul, con la componente de frecuencia
tanas. cero llamada función de escalamiento de Haar con am-
plitud 4, en color verde, se obtiene la señal original con
Hasta ahora se ha visto la importancia de crear un reconstrucción perfecta 7, 5, 3 y 1 que ha sido analizada
espectro de tiempo-frecuencia. Las funciones senoidales a diferentes frecuencias.
son muy importantes en el análisis frecuencial. Otro tipo
de funciones menos conocidas, pero no por ello menos
importante son las funciones wavelet [3]. Las funciones
wavelet, a diferencia de las funciones senoidales, no osci-
lan por siempre, y se desvanecen rápidamente. Una de las
funciones wavelet más conocidas es la función de Haar
[4]. Con funciones wavelet se pueden hacer comparacio-
nes sin necesidad de “recortar” una señal senoidal con
alguna ventana, ya que una wavelet define una ventana
de observación. Además, también es posible modificar su
frecuencia, posición y amplitud para repetir el mismo al- Figura 6. S. Descomposición y reconstrucción de una se-
goritmo de descomposición que con ventanas de Fourier ñal discreta 7, 5, 3, 1 con filtros H = (1/2, −1/2) y
y así obtener la información de tiempo-frecuencia y am- L = (1/2, 1/2).
plitud con la que empatan las componentes conocidas.
Un resultado muy interesante fue obtenido por Es importante aclarar que de acuerdo con el Teorema
Stephanie Mallat [5] quien demostró que, para señales de Parseval, los valores 4, 2, 1, 1 deben tener la misma
digitales, es posible realizar la descomposición tiempo- energía que la señal 7, 5, 3, 1 que es 84. Esto se puede
√ re-
frecuencia de una señal digital usando solo convolución solver ajustando los filtros H y L con un factor de 2. El
con filtros digitales y desplazamientos “diádicos”: saltan- filtrado o convolución con el filtro Haar puede calcularse
do de 2 en 2. Por ejemplo, el filtro para frecuencias al- con el método descrito previamente en cualquier lenguaje
tas o wavelet Haar unidimensional es H = (1/2, −1/2) de programación. Además, está disponible en bibliotecas,

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 82 / 88
como por ejemplo PyWavelets [6] de Python, para un nú- ñales en una dimensión, como las señales de audio. En
mero finito de filtros wavelet, aunque ciertamente existe el caso bidimensional puede aplicarse para analizar, por
un número infinito de wavelets. ejemplo, imágenes capturadas con alguna cámara. Hoy
Una propiedad interesante de las funciones wavelets en día se usan demasiado las cámaras digitales, en gran
construidas con un análisis multiresolución es que puede parte porque están incluidas en los teléfonos celulares,
expresarse como una suma de ellas en versiones trasla- tabletas, o en las cámaras web para videoconferencia y
dadas y escaladas complementadas con funciones de es- muchos de esos dispositivos aplican, de alguna manera,
calamiento [3][4]. El concepto de multiresolución invita una convolución.
a pensar que una señal puede verse como un bosque a Así como la convolución en una dimensión consiste
larga distancia con un telescopio en perspectiva de vista en dejar fija una señal e ir desplazando otra para luego
panorámica, y modificar su amplificación para acercarse multiplicar y sumar, también se puede hacer en el caso
a ver los árboles, y luego las hojas de los árboles, los de- bidimensional, como se ilustra en la Figura 7, en donde
talles de las hojas, etcétera, aprovechando los diferentes la señal o filtro de convolución se va moviendo en sentido
niveles de resolución. La convolución no solo aplica a se- horizontal y vertical.

La relación entre wavelets y redes neuronales puede ser a través del


procesamiento para crear descriptores o con funciones de activación
wavelet.
Y si estos procesos ya los realiza nuestro cuerpo en
forma natural ¿por qué el interés de comprender cómo
funciona? Porque en la medida que comprendemos mejor
el cuerpo humano se pueden construir dispositivos para
atender ciertas enfermedades, crear robots humanoides,
y en general construir modelos de IA. ¿IA? Inteligencia
Artificial, que intenta imitar este razonamiento humano
con computadoras al incorporar, por ejemplo, análisis y
reconocimiento de señales.
Actualmente hay una proliferación de bibliotecas pa-
ra lenguajes como Python donde es posible desarrollar
potentes modelos de reconocimiento de audio o ima-
gen, detección de objetos en movimiento en videos de
Figura 7. Convolución bidimensional con una “máscara ver- vigilancia en aeropuertos, por mencionar sólo algunas
de” que representa 4 valores de un filtro. aplicaciones, además de análisis de series financieras,
sísmicas, etc.
Tanto la similitud y su contraparte “disimilitud” son
importantes porque permiten discriminar si algo es, se ¿Y qué hay de las redes neuronales arti-
parece o es distinto a otro objeto. Calcular descriptores
de tiempo-frecuencia facilita discernir entre señales con ficiales con wavelets?
diferente espectro de energía como el caso 1/4, 1/4, 1/4, Es muy común encontrar aplicaciones de redes neurona-
1/4 comparado con 1, 0, 0, 0. Al escuchar un sonido, les sin uso de wavelets. Existen al menos dos maneras de
una canción o una persona hablando, el oído junto con relacionar ambos conceptos. La primera es al preproce-
el sentido auditivo y el cerebro realizan un análisis para sar una señal para extraer descriptores tiempo-frecuencia
obtener su descomposición tiempo-frecuencia y en base que se usen como datos de entrada de una red neuronal, y
a esos descriptores identificar si es quizá el maullido de la segunda es a través de wavelets como funciones de ac-
un gato o el ladrido de un perro, o también identificar tivación en las diferentes capas de una red neuronal. Por
la canción de un artista famoso o de algún imitador, si ahora, conviene abordar el término de redes neuronales
la persona que habla es algún desconocido o un familiar, artificiales.
aun con los ojos cerrados. Y ¿cómo es que las personas El término mismo en plural refiere a dos cosas: pri-
logramos hacerlo? Todo indica que, al obtener caracte- mero, como un conjunto de neuronas artificiales interco-
rísticas de la señal de audio, estas se procesan en nuestra nectadas para realizar una función de clasificación. Por
red neuronal que es capaz de aprender y clasificar estas ejemplo, el modelo de Perceptrón de la Figura 8 conside-
señales. ra una función de activación tipo escalón y para pares de

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Artículo Komputer Sapiens 83 / 88
valores (0,0), (0,1), (1,0) y (1,1) puede definir una región Conforme se avanza en nuevos modelos de redes neu-
lineal de separación con pesos sinápticos apropiados w0, ronales, hay conceptos tales como la convolución que son
w1 y w2 para la operación lógica OR, es decir que para fundamentales, y al parecer será difícil reemplazarlos.
los 4 pares de entradas se obtenga 0, 1, 1, 1 respectiva- En las neuronas artificiales, un elemento que a veces
mente. Sin embargo, este modelo de neurona es incapaz no le damos gran importancia es la función de activación.
de separar los valores de entrada para la operación XOR En el modelo del perceptrón previamente mostrado en
y XNOR que corresponden a las salidas 1, 0, 0, 1 y 0, 1, la Figura 8, se consideró la función escalón, pero al paso
1, 0 respectivamente. Pero si se combinan más percep- de las décadas se han estudiado otras como la función
trones [9], es posible definir regiones de separación para logística o la función tangente hiperbólica, en particu-
las operaciones XOR y XNOR. Se trata de un trabajo lar para las capas densas. En aprendizaje profundo, en
colaborativo neuronal. el gran número de capas de preprocesamiento previo a
Una segunda forma de explicar el plural de redes neu- las capas densas, suelen incluirse funciones ReLu, Ge-
ronales es que no existe un solo tipo de red. Existen redes Lu, Mish, Swish, entre otras, las cuales han tenido tanto
pulsantes, redes autoorganizadas o mapa de Kohonen, éxito que parecen ser “estándares” únicas y suficientes.
redes con memoria de corto plazo, redes recurrentes, en- Pero también se han explorado wavelets como funciones
tre otras además de las redes para aprendizaje profundo de activación, y estudios recientes con las plataformas de
[7][8]. Keras (www.keras.io) y Tensorflow (www.tensorflow.org)
muestran que la combinación de las funciones “estándar”
junto con wavelets permiten mejorar los resultados de
clasificación. De hecho, el problema de las operaciones
XOR y XNOR puede resolverse con una neurona con fun-
ción de activación wavelet [9]. Los resultados de aplicar
wavelets como funciones de activación son alentadores en
áreas donde ya se ha aplicado aprendizaje profundo como
es la clasificación de imágenes y el análisis de series de
tiempo bursátiles. Las series de tiempo bursátiles presen-
tan comportamientos no estacionarios, lo cual dificulta
su predicción.
Una señal es no estacionaria, cuando al paso del tiem-
po, su distribución de probabilidades cambia. Algo simi-
lar a lo ilustrado en la Figura 4. Más aún, se refiere a
discontinuidades, cambios abruptos, con poca duración,
Figura 8. Un perceptrón con dos entradas, función de acti- no repetitivos y de singularidades. Por tanto, la inclu-
vación escalón, tres pesos sinápticos y una salida. sión de wavelets en alguna parte del modelo neuronal
ya sea para preprocesar una señal y obtener descriptores
Anteriormente, era popular procesar las señales para tiempo-frecuencia o como funciones de activación, segu-
extraerles características como las del dominio temporal ramente aportará buenos resultados que sólo asumir un
y frecuencial, para luego introducirlas a las redes neuro- comportamiento periódico o estacionario.
nales artificiales, que con los pesos sinápticos y número Hasta ahora se ha presentado el análisis de señales
de neuronas adecuados eran capaces de discernir señales existentes, pero también se puede abordar el caso opues-
mucho más complicadas. Actualmente, en aprendizaje to. ¿Cómo opuesto? Sí, en donde a partir de generar
profundo, la arquitectura de las redes neuronales arti- un espectro de frecuencias con ciertas características se
ficiales incluye una capa para recibir datos de entrada, pueden obtener señales “peculiares”. ¿Peculiares? Al ana-
varias capas de procesamiento para extraer caracterís- lizar muchas palabras (señales de voz) mencionadas por
ticas (por ejemplo, de tiempo o frecuencia) a través de una persona y calcular sus características de tiempo-
capas convolucionales, además de otras capas “Pool” para frecuencia, se puede deducir que tienen muchísimas cosas
reducir la dimensión de los datos, “MaxPool” que reem- en común: los patrones de pronunciación de la persona.
plaza una ventana por un valor máximo o “AveragePool” Luego, es posible generar variantes de las mismas pa-
que reemplaza con un valor promedio. Además, se usan labras sin que sean idénticas a cualquiera de las origi-
capas “Flatten” que convierte datos multidimensionales nales. Hay dos desafíos, por un lado, que se generen se-
a unidimensionales para enviarlas a capas “Densas” con ñales con las mismas características de pronunciación, y
muchas conexiones sinápticas. Finalmente, se usa una ca- segundo, que no sean idénticas a las originales, enton-
pa de salida para mostrar los valores de decisión. Debido ces se tiene la posibilidad de generar palabras que nunca
a que se usan muchas capas, se le ha llamado aprendizaje ha pronunciado la persona y que si las pronunciara fue-
profundo. ra prácticamente imposible saber si las dijo esa persona

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 84 / 88
o fueron generadas por un programa de computadora. tipos de redes neuronales: pulsantes, mapas de Kohonen,
Claro, ese programa usaría Inteligencia Artificial. Este con memoria de corto plazo, y recurrentes, entre otros
concepto ya existe, y en efecto, cuando el programa de con múltiples aplicaciones al análisis de señales que han
computadora es una red neuronal artificial, se les deno- mostrado éxito en áreas como el reconocimiento de voz o
mina redes neuronales adversariales [10]. El uso de redes rostros, pero también en la creación artística con modelos
neuronales adversariales ha mostrado éxito, por ejemplo, adversariales, que en conjunto permiten vislumbrar un
en la generación de rostros, en donde una motivación es futuro en donde seguramente tendrá gran participación
tener bases de datos de rostros de personas que no co- la Inteligencia Artificial y la correspondiente demanda de
rrespondan a ninguna persona real. ¿Cómo reaccionaría profesionales en esta fascinante área del conocimiento.✵
el lector si en alguna entrevista o video apareciera su
voz o rostro sin que hubiera participado? También se ha REFERENCIAS
explorado usarlas para generar nuevas obras de arte, pin-
turas, música, etc. Sorprendente ¿no? Los nuevos artistas 1. Carrillo, G.C.J. (2003). Fundamentos del Análisis de Fourier.
Vigo, España, Universidad de Vigo.
podrían ser pintores o músicos artificiales.
Todo lo anterior no sería posible entenderlo y aplicar- 2. Hsu, H.P. (1987). Análisis de Fourier. Wilmington, Addison
Wesley Iberoamericana.
lo sin el concepto de análisis temporal y frecuencial, que
deja ver una mirada al horizonte de lo que se producirá 3. Daubechies, I. (1992). Ten lectures on wavelets. Philadelphia,
PA, Society for Industrial and Applied Mathematics.
en las siguientes décadas con el uso de la Inteligencia
Artificial. 4. Soman, N.G., Ramachandran, K.P., y Resmi, K.I. (2010). In-
sight into wavelets from theory to practice, PHI.
Conclusiones 5. Mallat, S.G. (1999). A wavelet tour of signal processing. San
Diego, Academic Press.
Los conceptos de señal, frecuencia, energía y tiempo- 6. PyWavelets. (2019). A Python package for wavelet analysis.
frecuencia son muy importantes en el análisis de seña- Recuperado el 1 de febrero de 2022, de https://pywavelets.
readthedocs.io/.
les, ya que permiten comparar señales bajo criterios de
similitud o disimilitud. La convolución es una operación 7. Caicedo, E.F., y López, J.A. (2017). Una aproximación práctica
a las redes neuronales artificiales. Cali, Colombia, Universidad
que reúne desplazamientos, multiplicaciones y sumas que del Valle.
ofrecen una manera de extraer características distintivas 8. Goodfellow, I., Bengio, Y., y Courville, A. (2016). Deep Lear-
de una señal a manera de huella digital. Es posible usar ning. MIT Press.
esas características distintivas o descriptores como datos 9. Herrera, O., y Priego, B. (2022). Wavelets as activation fun-
preprocesados que sean clasificados con redes neuronales ctions in Neural Networks. Journal of Intelligent and Fuzzy
al usar capas convolucionales en el aprendizaje profun- systems, 1-11.
do. El análisis wavelet como complemento del análisis de 10. Calcagni, L.R. (2020). Redes Generativas Antagónicas y sus
Fourier ofrece un marco teórico y práctico para analizar aplicaciones. Trabajo final para la obtención del título Especia-
lista en Inteligencia de Datos Orientada a Big Data. Universidad
señales con comportamiento no estacional. Existen varios Nacional de la Plata, Argentina

SOBRE EL AUTOR

Oscar Herrera Alcántara es profesor investigador de la Universidad Autónoma Metropolitana Azca-


potzalco en la Ciudad de México. Sus líneas de investigación incluyen el análisis wavelet y aplicaciones
en el procesamiento de señales con redes neuronales.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 85 / 88

IA & Educación
Julieta Noguez, Lucía Barrón y Yasmín Hernández
iaeducacion@komputersapiens.org
La Evaluación Adaptativa en los 4. Repetir pasos 1 a 3 hasta alcanzar el criterio de
Ambientes de Aprendizaje en Línea terminación de evaluación.
La evaluación es parte primordial del proceso educativo. Actualmente, en el mundo occidental, casi todos los
La tendencia mundial es ofrecer entornos adaptables y programas de pruebas a gran escala son adaptativos o
flexibles que personalicen la evaluación del aprendizaje están en proceso de serlo [5]. Algunos de los campos en
de los estudiantes, a pesar de las diferencias en sus cono- los que se han implementado herramientas de evalua-
cimientos previos. Los sistemas informáticos de evalua- ción adaptativa en línea son Física, Matemáticas, Inglés
ción adaptativa están diseñados para medir el desempeño y Computación [6].
de personas o equipos. En función de las respuestas de Las herramientas de evaluación adaptativas también
los usuarios en curso, o los patrones de respuesta, estos han incorporado los conceptos de analíticas de aprendiza-
sistemas adaptan su presentación y el rendimiento de la je en el modelado del comportamiento de los estudiantes.
pantalla para hacer coincidir el nivel de evaluación con Lo anterior tiene como finalidad lo siguiente: a) predecir
el del alumno o el equipo [1]. su rendimiento académico; b) aumentar la auto-reflexión
En el proceso de evaluación se busca brindar al es- y la autoconciencia de las responsabilidades y roles en el
tudiante ambientes adaptativos que provean contenidos, proceso de enseñanza-aprendizaje, tanto de los alumnos
actividades, recursos y evaluaciones de acuerdo con su es- como de los docentes; y c) mejorar los servicios de retro-
tado actual de conocimiento y características de su perfil. alimentación y evaluación. Adicionalmente, es posible, en
Existen técnicas estadísticas y de inteligencia artificial, principio, predecir la deserción y buscar la permanencia
mediante las cuales es posible identificar las variables que de los estudiantes, así como hacer recomendaciones sobre
influyen en el aprendizaje de los estudiantes y establecer el uso de los recursos educativos [7].
un orden jerárquico según su importancia. Identificar es- Esta tendencia educativa está en auge gracias a la
tas variables permite diseñar un modelo que seleccione gran cantidad de datos que se recopilan en los entornos
aquellas características relevantes de cada alumno, con de aprendizaje en línea. Esto es con el fin de lograr la
el objetivo de desarrollar estrategias de aprendizaje per- adaptación de los contenidos y materiales educativos de
sonalizadas [2]. los estudiantes según sus necesidades de aprendizaje. Ac-
Dentro de este conjunto, y con el fin de lograr que el tualmente, estos ingredientes del aprendizaje siguen evo-
aprendizaje de cada estudiante sea más eficiente y efec- lucionando para considerar rasgos cognitivos y afectivos,
tivo, los entornos de evaluación en línea seleccionan las así como conocimientos previos.✵
preguntas que se presentan. En esta línea, se evitan pre- REFERENCIAS
guntas que el estudiante ya conoce para dirigirlo a las
áreas que necesita estudiar [3]. Las pruebas adaptativas 1. Wilson, C., y Scott, B. (2017). Adaptive systems in education: a
review and conceptual unification. The International Journal
computarizadas (CAT por sus siglas en inglés) se adap- of Information and Learning Technology, 34(1), 2-19.
tan de forma individual y automática al nivel de com- 2. Gonzalez-Nucamendi A., Noguez J., Neri L., Robleda-Rella, V.,
petencia de los examinados. El método básico que usan García-Castelan, R.M., Escobar-Castillejos, D.E. (2021). The
los sistemas CAT se basa en un algoritmo iterativo que Prediction of Academic Performance using Engineering Stu-
dent’s Profiles. Computers and Electrical Engineering. Special
contiene los siguientes cuatro pasos [4]: Issue VSI-tei. ISSN: 0045-7906.
3. Noguez, J., Neri, L., Robledo-Rella, V., García-Castelán, R.,
1. Seleccionar pregunta. Buscar en el banco de González-Nucamendi, A., Elizalde, J. (2019). Design aspects
preguntas disponibles la pregunta ideal con base of adaptive evaluation for an online Sciences and Enginee-
ring learning environment. 2019 Virtual Concept Internatio-
en la habilidad actual estimada del estudiante. nal Workshop on Educational Innovation in Engineering and
Sciences: Technologies for the Future of Learning, Monterrey,
2. Presentar la pregunta al estudiante. El estu- N.L. México.
diante responde la pregunta de forma correcta o 4. Thissen, D., y Mislevy, R.J. (2000). Testing Algorithms. En
incorrecta. Wainer, H. (Ed.) Computerized Adaptive Testing: A Primer.
Mahwah, NJ: Lawrence Erlbaum Associates.
3. Actualizar habilidad estimada del estudian- 5. Martin, A. J., y Lazendic, G. (2018). Computer-adaptive tes-
te usando como base todas las respuestas previas ting: Implications for students’ achievement, motivation, enga-
gement, and subjective test experience. Journal of Educational
recibidas. Psychology, 110(1), 27.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 86 / 88
6. Hirose, H., Takatou, M., Yamauchi, Y., Taniguchi, T., Hon- (IIAI-AAI), 433-438.
da, T., Kubo, F., y Koyama, T. (2016). Questions-and-Answers
Database Construction for Adaptive Online IRT Testing Sys- 7. Dietz-Uhler, B., y Hurn, J. E. (2013). Using Learning Analytics
tems: Analysis Course and Linear Algebra Course. En 2016 5th to Predict (and Improve) Student Success: A Faculty Perspec-
IIAI International Congress on Advanced Applied Informatics tive. Journal of Interactive Online Learning.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 87 / 88

Deskubriendo Konocimiento
Alejandro Guerra Hernández y Gildardo Sánchez Ante
deskubriendokonocimiento@komputersapiens.org

Revisión de “Game of Life Cellular Automata” *


Dr. AlejandroUniversidad
Raúl Hernández
Veracruzana
Montoya
Instituto de Investigaciones en Inteligencia Artificial

en su famosa y muy leída sección de las tendencias filosóficas de ca-


“matemáticas recreativas” de la re- da quien), del juego de la Vida, por
vista “Scientific American”. En par- Conway.
ticular, un artículo de Gardner pu- Estrictamente hablando, Life no
blicado en 1970 y titulado “The fan- es realmente un juego, en el sentido
tastic combinations of John Con- tradicional de este término, ya que
way’s new solitaire game “life””, po- no es interactivo, y una vez inicia-
pularizó el “juego de la vida”. In- do sigue una evolución única y de-
ventado por Conway 10 años antes terminista, ya que es una maquina
de ser dado a conocer por Gard- virtual que evoluciona en un espa-
ner en el mencionado artículo, “el cio bidimensional discreto, o malla,
juego de la Vida”, al cual de aquí formado de celdas cuadradas, ideal-
en adelante llamaremos sólo Life, mente en número infinito, pero en la
es seguramente el autómata celu- práctica formado de N x N celdas,
lar más conocido por las comunida- donde cada celda puede encontrar-
des de gente dedicada a las ciencias se en uno de dos posibles estados:
de la computación, las ciencias de “viva” o “muerta”. Cada celda es-
la complejidad y muchos aficiona- tá rodeada simétricamente por un
dos con un gusto por la matemáti- arreglo también cuadrado de ocho
ca y la programación. El libro que celdas que forman su vecindad, cua-
Portada de la revista.* reseñamos aquí, Game of Life Ce- tro a los lados de la celda en cues-
El matemático inglés John Horton llular Automata, (GOLCA), publi- tión y las otras cuatro diagonalmen-
Conway (1937-2020), desafortuna- cado en el 2010, fue expertamen- te con respecto a dicha celda, para
damente fallecido en abril del 2020 te editado por Andrew Adamatzky, formar un arreglo cuadrado que in-
como una baja temprana de la epi- quien es por sí mismo, un líder alta- cluye a la celda central, de 3 x 3
demia del Covid-19, hizo importan- mente reconocido en los campos de = 9 celdas. A partir de una confi-
tes aportaciones en diversas áreas los autómatas celulares, la compu- guración inicial de la malla de cel-
de las matemáticas, principalmente tación de reacción-difusión, compu- das vivas y muertas, éstas actuali-
en teoría de números, teoría de gru- tación masiva paralela, matemáti- zan sus estados simultáneamente y
pos finitos, teoría de juegos combi- cas aplicadas, inteligencia colecti- en tiempos discretos de acuerdo a
natorios, computación y otras áreas va y robótica. Andrew Adamatzky los estados de sus respectivas vecin-
de la ciencia, incluso en la Física. es profesor en el departamento de dades, siguiendo las siguientes re-
Era un gran aficionado a los jue- Ciencias de la Computación y del glas de evolución o actualización:
gos y a las matemáticas recreativas; Laboratorio Bristol de Robótica de una celda muerta revive si en su ve-
muchos de sus trabajos relaciona- la Universidad del Oeste de Ingla- cindad hay tres vecinos vivos; una
dos con estos intereses fueron dados terra, en Bristol. El libro fue edi- celda viva permanece viva si dos o a
a conocer por el gran divulgador de tado con motivo del cuadragésimo lo más tres de las celdas en su vecin-
las matemáticas, la razón y de la aniversario del descubrimiento, o si dad están vivas; en todos los demás
ciencia en general, Martin Gardner, se quiere, invención (dependiendo casos la celda muere. El juego de
* Adamatzky, Andrew (Ed). Game of Life Cellular Automata. Springer-Verlag, Germany, 2010.

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Año XIV, Vol. II. Mayo - Agosto 2022 Columna Komputer Sapiens 88 / 88
la vida es un tipo particular de au- do tan actual como en el año de su tados continuos de estas, celdas con
tómata celular. Estos son sistemas publicación. Esto puede ser aprecia- memoria, celdas con forma distinta
dinámicos que evolucionan en pasos do por el número total de citas que a la cuadrada, Life en tres dimen-
de tiempo discreto sobre un espa- ha obtenido y en la evolución de és- siones, Life sobre teselaciones de
cio discreto y regular de celdas en tas año con año. Así, según Goo- Penrose, sobre una esfera, versiones
una o varias dimensiones, y que re- gle Scholar, el libro que reseñamos cuánticas de Life, etc.); perturba-
montan sus orígenes a nombres tan aquí, ha obtenido en total 240 citas ción estructural de Life; criticalidad
ilustres como los matemáticos John desde el año de su publicación, es y transiciones de fase en Life; creci-
Von Neumann y Stanislaw Ulam, decir en menos de doce años, con un miento no estacionario de patrones
creadores de los algoritmos de au- número creciente de éstas año con de reacción-difusión en autómatas
tómatas celulares a principios de los año, empezando con 3 citas en el celulares binarios en 2D; compleji-
años 1950’s. año de su publicación, 6 citas en el dad de Life, estructuras emergen-
Es verdaderamente notable que 2011, 19 en el 2012 y sigue creciendo tes, complejidad espacial macros-
un sistema dinámico determinista, así, hasta llegar a alcanzar 42 citas cópica de Life (propiedades esta-
con la sencillez de Life, alcance tan en el año de 2020 y 26 citas en el dísticas emergentes); ecuaciones del
alto grado de complejidad, tal como 20201, para, a la fecha, alcanzar en campo electromagnético de Max-
lo atestiguan cada uno de los vein- total las mencionadas 240 citas. well acopladas con Life; computabi-
tisiete artículos seleccionados ex- GOLCA empieza con una intro- lidad Universal en Life; una má-
pertamente por el Profesor Ada- ducción al juego de la vida, pa- quina de Turing construida en Li-
matzky en GOLCA. Estos artícu- ra después dividirse en seis partes fe; computación con patrones de Li-
los de investigación fueron escritos que incluyen el rango de disciplinas fe (construcción de puertas lógicas
por treinta y cinco autores exper- científicas que contribuyen al avan- y circuitos aritméticos elementales)
tos en el tema de Life, incluido el ce de la investigación en autóma- e incluso generación de música me-
propio Adamatzky, adscritos a im- tas celulares, y en particular el jue- diante Life, etc.
portantes instituciones académicas go de la vida, y que son: 1) Histo- Algunos de estos artículos son
de todo el mundo. Algunos de estos ria, 2) Temas clásicos, 3) Autóma- teóricos, con alto rigor matemático,
artículos son clásicos y bien conoci- tas asíncronos, continuos y con me- otros presentan análisis empíricos y
dos, mientras que otros fueron escri- moria, 4) Mallas no ortogonales, 5) algunos son de carácter experimen-
tos recientemente, ex profeso, para Complejidad, 6) Física, 7) Música y tal/computacional, pero todos son
el libro, lográndose así recopilar en 8) Computación, y presenta temas comprensiblemente explicados y las
un solo volumen cuarenta años de tan variados y atractivos como los ilustraciones de alta calidad del li-
investigación sobre los diversos as- siguientes, no necesariamente en el bro clarifican óptimamente las ideas
pectos de interés del autómata celu- orden de aparición en el libro: In- del texto.
lar “el juego de la vida”, para las co- troducción al juego de la vida, pa- El libro editado por Andrew
munidades de Ingeniería, Ciencias trones emergentes en el juego de la Adamatzky que hoy reseñamos tie-
de la Computación e IA, Física y vida (un tema muy gustado entre ne mucho que ofrecer a todos los
Matemáticas, e incluso muchas par- los aficionados a Life y a la compu- interesados en los autómatas ce-
tes de éste pueden ser entendidas tación); cálculo de patrones periódi- lulares, en particular en Life, sus
por aficionados con una buena mo- cos en Life mediante los diagramas matemáticas, variaciones, imple-
tivación. de de Bruijn; búsqueda de estados mentación, aplicaciones, compleji-
La compilación de artículos he- de baja periodicidad en Life; clasifi- dad, experimentación con Life, etc.,
cha por Andrew Adamatzky, no so- caciones alternativas de autómatas ya sean investigadores, estudian-
lo muestra el estado del arte de la celulares bidimensionales; evolución tes de licenciatura o de posgrado
investigación en el juego de la vi- espacio-temporal de variaciones del en áreas de las ciencias exactas,
da hasta el año de su publicación, juego de la vida; programación con computación e IA, sin excluir a los
sino que también mostraba diversas restricciones; generalizaciones y va- principiantes y aficionados al tema.
ideas a desarrollar, conjeturas y lí- riaciones de Life (vecindad, reglas, Por todo lo escrito este fantástico
neas de investigación y de explora- actualización probabilista asíncro- libro es altamente recomendable.✵
ción futura, por lo que sigue sien- na de los estados de las celdas, es-

© 2022 - Sociedad Mexicana de Inteligencia Artificial ISSN 2007-0691


Información tomada de: https://coronavirus.gob.mx
Indizada en el IRMDCT de CONACYT y en Latindex

¡Publique en Komputer Sapiens!

Komputer Sapiens solicita artı́culos de divulgación en todos los temas de Inteligen-


cia Artificial, dirigidos a un amplio público conformado por estudiantes, académicos,
empresarios, tomadores de decisiones y consultores. Komputer Sapiens es patrocinada
por la SMIA, la Sociedad Mexicana de Inteligencia Artificial

www.smia.org.mx

Instrucciones para autores e información general: http://www.komputersapiens.org


Sı́guenos en las redes sociales: www.facebook.com/Komputer.Sapiens, twitter.com/KomputerSapiens

También podría gustarte