Está en la página 1de 15

APRENDIZAJE AUTOMÁTICO

Para tratar el tema del aprendizaje automático existen diferentes enfoques, estos se

diferencian en el énfasis que le ponen a un aspecto en la definición, se presenta a

continuación un resumen de diferentes autores a manera de ir visualizando el énfasis en el

que se apoyan.

Se comienza presentando la opinión de Barlet, Codino y Solé (2008), quienes afirman que:

El aprendizaje automático es una rama de la inteligencia artificial que permite a los

ordenadores recolectar de forma automatizada conocimiento basándose en un número

limitado de ejemplos, conocido como un conjunto de entrenamiento. (Barlet, Codina y

Solé, 2008).

Se presenta la opinión de Mitchell (1997), que sostiene que:

“El aprendizaje automático es un campo multidisciplinario cuyo objetivo es desarrollar

programas de computadora que mejoren su funcionamiento en ciertas tareas a partir de la

experiencia” (p.378).

Mitchell en esta definición trata la experiencia como el entrenamiento que deben tener los

programas antes de entrar en producción.

Otros de los enfoques del concepto de aprendizaje automático es poner énfasis en el uso de

datos y los algoritmos con una programación no explícita. Tal como lo define Bishop

(2016):

“Los algoritmos Machine Learning (ML) intentan construir modelos basándose en los datos

con objetivo de hacer predicciones o tomar decisiones, como si fueran verdaderos expertos,

en lugar de seguir las instrucciones de manera explícita para lo que han sido programados”

(p.437).

Con énfasis en los datos Kovahi y Provost (1998) definen:


“El ML como una disciplina proveniente de las ciencias y la ingeniería que se ocupa de la

construcción y el estudio de los algoritmos que pueden aprender a partir de datos, en este

caso de los Big-data” (p.437).

Otras definiciones como las de Aguilar, Torres y Martín (2019), Soto (2018) y Morante

(2009) refuerzan lo opinado anteriormente y se presenta a continuación:

El aprendizaje automático tiene como objetivo construir modelos en base a datos

observados, también podemos decir que es un conjunto de algoritmos cuyo fin es proveer a

los ordenadores la capacidad de aprender sin la necesidad de ser programados. (Aguilar,

Torres y Martín, 2019).

El aprendizaje automático se encargar de desarrollar sistemas computacionales que están

diseñados para aprender y adaptarse en base a datos, sin la necesidad de programarlo

explícitamente el nuevo conocimiento adquirido. (Soto, 2018).

El aprendizaje automático se provee de conocimientos a partir de datos que son adquiridos

de forma automática. (Morante, 2009).

Se observa de estas definiciones que el aprendizaje automático tiene que ver con grandes

volúmenes de datos, con algoritmos no convencionales, con entrenamiento que genera la

experiencia, estos aspectos son muy similares a la forman como aprende el ser humano.

Historia del Aprendizaje Automático

El comienzo del siglo XXI ha visto el nacimiento de una nueva revolución, la de la

información. Sólo entre 2013 y 2015 la humanidad generó más datos que en toda su

historia previa. Esta avalancha de bytes ha servido como catalizador para el desarrollo

de herramientas capaces de clasificar grandes cantidades de información. Es en este

marco donde los denominados algoritmos de Machine Learning han encontrado un

terreno fértil donde prosperar. Se define Machine Learning como la disciplina del
ámbito de la Inteligencia Artificial que crea mecanismos capaces de aprender de

forma autónoma. En general, la característica principal de todos los algoritmos de

este tipo es que su comportamiento está determinado por una serie de parámetros, y

mediante el empleo de grandes muestras de entrenamiento, se busca modificar estos

parámetros de manera que el algoritmo sea capaz de llevar a cabo una tarea

clasificatoria de manera eficaz. (Tornero, 2017, p.2)

Aplicaciones del Aprendizaje Automático

¿Cómo se puede aplicar a la publicidad? En Infinia lo utilizamos para dos fines

principalmente: inferir el género, la edad, ubicar el hogar, la zona vital y el trabajo,

mediante la aplicación del ML a los miles de millones de datos que tenemos en

nuestra data lake (apps disponibles en el terminal del usuario, localizaciones, urls

visitadas…); y elaborar audiencias look-a-like, integrado con la plataforma big data

para que el resultado esté automáticamente disponible.

Actualmente estamos trabajando para ampliar su uso hacia la optimización del

performance de campañas, integrando el ML en el proceso de compra programática.

(Fernández, 2018)

En 2003, Minaei-Bidgoli, Kashy, Kortemeyer and Punch presenta un enfoque para

predecir la calificación final de los alumnos, basado en varias características extraídas

de los datos registrados en un sistema educativo basado en la web. El conjunto de

datos consistió de 227 ejemplos, que se agrupan en diferentes casos de acuerdo con

sus calificaciones finales. Utilizaron los clasificadores de Bayes, k-vecinos más

cercanos, redes neuronales artificiales y árboles de decisión. Informaron que k-

vecinos más cercanos obtienen los mejores resultados, con un 82,3% de precisión;
Sin embargo, los árboles de decisión también obtuvieron buenos resultados. (Urbina,

AB., y De la Calleja, J., 2017, p.89)

Thomas y Galambos (2004) utilizaron análisis y decisión árboles de regresión con el

algoritmo CHAID (Chi-cuadrado Detección automática interacción) para identificar

la satisfacción académica de los estudiantes de cada tres aspectos principales:

experiencias académicas, integración social y servicios del campus en infraestructura.

Los resultados obtenidos mediante el análisis del árbol de decisión revelaron que la

integración social es un factor determinante para la satisfacción de los estudiantes,

sobre todo para los estudiantes que participan menos académicamente. Por otra parte,

los servicios y las instalaciones del campus tenían un efecto menor sobre su

satisfacción. (Urbina, AB., y De la Calleja, J., 2017, p.90)

Kotsiantis, Pierrakeas y Pintelas (2004) llevaron a cabo dos experimentos para

predecir el rendimiento de los estudiantes nuevos en la ingeniería informática en la

Universidad Abierta Helénica, Grecia. Experimentaron el uso de seis algoritmos:

árboles de decisión, redes neuronales, Naïve Bayes, K-vecinos más cercanos, la

regresión logística y máquinas de vectores de soporte. En el primer experimento, se

utilizaron 354 casos, mientras que, para el segundo experimento, se consideraron sólo

28 casos, ya que era difícil de obtener más de 30 casos por año académico. Después

de realizar el segundo experimento, encontraron que estos 28 casos son

probablemente insuficientes si se desea una mayor precisión; sugirieron el uso de al

menos 70 casos para una mayor precisión. Cuando se compararon los seis algoritmos,

los autores llegaron a la conclusión de que el algoritmo de Bayes ingenuo es el más


adecuado para construir una herramienta de soporte de software para predecir el

rendimiento de los nuevos estudiantes. La precisión global de los dos experimentos

era mejor con el algoritmo de Bayes ingenuo, con aproximadamente 72% de

precisión, y la sensibilidad global fue de aproximadamente 78%. Por otra parte, los

autores recomiendan que el algoritmo Bayes ingenuo es más fácil de implementar.

(Urbina, AB., y De la Calleja, J., 2017, p.90)

Uno de los objetivos de un sistema de enseñanza basado en la web es que los

estudiantes son capaces de aprender a pesar de sus diferentes estilos de aprendizaje.

Con el fin de lograr este objetivo, primero es necesario identificar cómo aprenden los

estudiantes. Por lo tanto, introducimos tres enfoques que abordan este problema

mediante el aprendizaje bayesiano. En el primer estudio, presentado por García,

Amandi, Schiaffino y Campo (2005), los estilos de aprendizaje se identificaron

utilizando el modelo de Felder. En el segundo artículo, García, Amandi y Campo

(2007) identifican el estilo de aprendizaje de los estudiantes en función de su

comportamiento, el cual fue grabado mientras interactuaban con el sistema educativo.

A continuación, se utilizó una red bayesiana para inferir el estilo de aprendizaje de la

conducta modelada. Su enfoque propuesto se evaluó en un curso de inteligencia

artificial Web. Por último, Schiaffino, García y Amandi (2008) introdujeron un

enfoque que utiliza un agente inteligente (e-profesor) para detectar estilos de

aprendizaje basados en acciones de los estudiantes en un sistema de e-Learning. Se

probaron su método usando la información del perfil de los estudiantes con el fin de

sugerir cursos a medida para ellos. (Urbina, AB., y De la Calleja, J., 2017, p.90)
En 2007, Acevedo, Caicedo y Loaiza (2007) utilizan sistemas inteligentes para

disminuir la subjetividad en los procesos de selección de la Armada de la República

de Colombia. Además, se utilizan redes neuronales artificiales para clasificar patrones

psicológicos con el objetivo de identificar los factores de deserción cadete. Se utilizan

dos tipos de redes neuronales: perceptrón multicapa y funciones de base radial. Para

llevar a cabo sus experimentos utilizaron un conjunto de datos de 200 perfiles

psicológicos para cadetes admitidos entre 1995 y 1998. Los resultados muestran que

el sistema fue capaz de predecir el rendimiento de admisión con una tasa de éxito de

alrededor del 70%. Los autores afirman que la precisión de la predicción aumenta

cuando la red neuronal se entrena con más datos relativos a los problemas

psicosociales de alta complejidad. (Urbina, AB., y De la Calleja, J., 2017, p.90)

Oladokun, Adebanjo y Charles-Owaba (2008) propusieron un modelo de red

neuronal para predecir el rendimiento de los posibles candidatos para la admisión a la

universidad. Su modelo se basa en una topología de perceptrón multicapa, con

antecedentes familiares, la edad, y la puntuación de la prueba de acceso se toma como

variables de entrada, entre otros. Se informó de alrededor del 74% de precisión en sus

resultados, pero se recomienda la realización de una entrevista oral para obtener más

información a suministrar a su modelo. (Urbina, AB., y De la Calleja, J., 2017, p.90)

En 2008, Baylari y Montazer introdujeron un sistema de e-Learning multi-agente para

recomendar materiales personalizados para los estudiantes, basados en personalizado

Teoría de Respuesta (IRT) usando una red neuronal artificial. Se llevaron metas de

los estudiantes, así como sus experiencias, conocimientos, habilidades y la


interactividad, como parámetros de entrada. Ellos encontraron que uno de los agentes

era capaz de diagnosticar problemas de aprendizaje, por lo que los estudiantes

podrían recibir las pruebas de adaptación con el fin de obtener un material didáctico

adecuado. Sus resultados experimentales muestran que el enfoque puede recomendar

los materiales a medida, de acuerdo con los cursos, con una precisión del 83,3%.

(Urbina, AB., y De la Calleja, J., 2017, p.90)

La minería de datos fue utilizada por Ranjan y Khalil (2008) con dos objetivos

principales: 1) la planificación de un curso para la gestión de la educación a través de

nuevas aplicaciones de minería de datos y para explorar los efectos sobre probables

cambios en los procesos de selección y admisión y cursos de orientación; y 2) la

garantía de evaluaciones de calidad, rendimiento de los estudiantes, cursos y tareas.

Además, estaban interesados en encontrar patrones en cómo los estudiantes

interactúan con otros, cómo se lleva a cabo el proceso de admisión, y los mecanismos

de asesoramiento para elegir los cursos. El marco se puso a prueba para encontrar qué

tipo de cursos son interesantes para ciertos tipos de estudiantes. Además, el marco

propuesto tenía tres procesos principales que por lo general se producen en todas las

instituciones de gestión, es decir, las admisiones (planificación, evaluación y

registro), de orientación y de asignación de los sujetos de especialización. Los

resultados se presentaron como un marco conceptual para adoptar la minería de datos

en la gestión de las instituciones. Los autores concluyeron que la minería de datos es

útil para predecir el éxito de los programas educativos, así como la comprensión de
los estilos de aprendizaje con el fin de promover la proactividad en los estudiantes.

(Urbina, AB., y De la Calleja, J., 2017, p.91)

Márquez, Ortega, González-Abril y Velasco (2008) utilizan una red bayesiana para

encontrar una ruta para adquirir competencias profesionales. Este método fue capaz

de predecir la probabilidad de éxito, teniendo en cuenta los perfiles de estudiantes y

datos históricos. Sus resultados muestran que la ruta varía cuando las preferencias y

necesidades de los estudiantes se cambian, teniendo en cuenta el aprendizaje unidad

pedagógica y el comportamiento social. Además, se introdujo un enfoque para

diseñar un camino útil para el aprendizaje dinámico utilizando el método de

optimización de colonias de hormigas. (Urbina, AB., y De la Calleja, J., 2017, p.91)

En 2009, Vialardi, Bravo, Shafti y Ortigosa sugirieron utilizar un sistema de

recomendación sujeto basado en la minería de datos para ayudar a los estudiantes a

tomar mejores decisiones cuando tienen que tomar cursos. Se analizaron los datos

relativos a los estudiantes de ingeniería de la Universidad de Lima, Perú, a partir de

los últimos siete años. Sus experimentos se realizaron utilizando el algoritmo C4.5,

que es un método basado en el árbol de decisión. Los resultados experimentales

muestran una exactitud global del 77,3%, con las condiciones modificadas para la

formación y las pruebas. Los autores también comentan que su enfoque proporciona

información pertinente sobre los estudiantes que no estarían disponibles cuando se

utilizan técnicas de estadística descriptiva. (Urbina, AB., y De la Calleja, J., 2017,

p.91)
En 2011, Anupama y Vijayalakshmin utilizan árboles de decisión, particularmente

ID3 y C4.5, para predecir el rendimiento de los estudiantes en su examen final. Esta

predicción ayudó a sus tutores en la identificación de los puntos débiles con el fin de

mejorar el rendimiento de los estudiantes. Los experimentos se realizaron utilizando

un conjunto de datos de 116 y 117 ejemplos, la obtención de una precisión media de

88% y 91%, respectivamente. Llegaron a la conclusión de que la minería de datos

ofrece varias ventajas en las instituciones de educación superior, y estas técnicas se

pueden aplicar en otras áreas de la educación para optimizar los recursos y predecir la

retención de los miembros de la facultad y retroalimentación tutor, entre otros fines.

(Urbina, AB., y De la Calleja, J., 2017, p.91)

Kumar y Pal (2011) utilizan árboles de decisión para extraer un conjunto de

características académicas para evaluar el rendimiento de los estudiantes. El conjunto

de datos consta de 50 ejemplos de los estudiantes del departamento de aplicaciones

informáticas en el VBS Universidad Purvanchal, India. Las características

consideradas incluyen grados en semestres anteriores, el rendimiento del seminario,

el rendimiento general de la competencia, y la asistencia. El conocimiento extraído y

representada por el árbol de decisión permitió a los autores para obtener reglas si-

entonces para clasificar a los estudiantes. Con este trabajo, los autores predicen el

rendimiento final de semestre de los estudiantes y se identificaron los estudiantes que

necesitan una atención especial para reducir la tasa de fracaso. (Urbina, AB., y De la

Calleja, J., 2017, p.91)


En 2013, Ayinde, Adetunji, Bello y Odeniyi describen un método para predecir y

clasificar el rendimiento académico de los estudiantes que usan el clasificador y

árboles de decisión de Bayes ingenuo. Los experimentos se llevaron a cabo utilizando

un conjunto de datos de 473 estudiantes del Departamento de Ciencias de la

Computación e Ingeniería, en la Universidad Akintola Ladoke de Tecnología,

Nigeria. Los resultados se obtuvieron mediante la aplicación de 10 veces la

validación cruzada y el porcentaje de división. Los autores informaron que el mejor

resultado se obtiene utilizando el clasificador bayesiano, con un 70% de precisión.

(Urbina, AB., y De la Calleja, J., 2017, p.91)

Yukselturk, Ozekes y Türel (2014) experimentaron con cuatro algoritmos: k-vecinos

más cercanos, árboles de decisión, el clasificador de Bayes ingenuo y redes

neuronales artificiales, para clasificar a los estudiantes que han abandonado la

escuela. El conjunto de datos se recogió mediante la administración de una prueba en

línea para 189 estudiantes matriculados en 2007 a 2009. Los algoritmos de

aprendizaje automático fueron entrenados y ensayaron usando el 10 veces técnica de

validación cruzada. Los mejores resultados se obtuvieron utilizando 3-vecinos más

cercanos y árboles de decisión, con una precisión del 87% y 79,7%, respectivamente.

Estos resultados fueron útiles ya que permiten la predicción de la deserción escolar en

el conjunto de datos del programa en línea. Por último, los autores llegaron a la

conclusión de que los métodos de minería de datos podrían ayudar a predecir las

diferentes razones por las que los estudiantes deciden abandonar los estudios antes de

terminar sus programas de estudio. (Urbina, AB., y De la Calleja, J., 2017, p.92)
Otro problema que se ha abordado el uso de algoritmos de aprendizaje automático se

introdujo por Kakavand, Mokfi y Tarokh (2014), con el fin de predecir la lealtad de

los estudiantes usando árboles de decisión. Los autores investigaron los factores

externos que pueden generar lealtad, con el fin de identificar a los estudiantes que han

decidido seguir estudiando, y por lo tanto la universidad pueden invertir en ellos y

aumentar su calidad educativa. Los experimentos se realizaron utilizando un conjunto

de datos de 135 casos para la formación, 33 para la prueba y 35 para la validación,

con 14 atributos por ejemplo (sexo, edad, y de ingresos, entre otros). El mejor

resultado se obtuvo usando el Carrito algoritmo de árbol de decisión, con un 94% de

precisión. (Urbina, AB., y De la Calleja, J., 2017, p.92)


Tendencias Futuras

Los asistentes digitales con algoritmos de auto capacitación podrían llegar a sus propias

conclusiones y programar reuniones, traducir documentos y hacerse cargo de otras tareas de

rutina. Se contará con máquinas que emitan recomendaciones para identificar en una etapa

temprana: falsas identidades, propaganda, ataques terroristas; y, habrá un sustancial

incremento de alertas para proteger la seguridad de los datos de los hackers. Todo lo

anterior, significa que, en un futuro, la Inteligencia Artificial estará inmersa en todos los

aspectos de la economía.

 Procesar billones de mensajes y textos de los celulares para detectar epidemias u

otros riesgos globales.

 Identificar plagios.

 Hacer modelajes predictivos sin necesidad de un modelo.

 Utilizar computadoras con un altísimo grado de desempeño que revolucionen la

forma en que hoy se diseñan los algoritmos.

 Hacer predicciones de clima espacial para determinar el mejor momento para

aterrizar en Marte.

 Elaborar predicciones en el planeta tierra sobre terremotos, explosión de volcanes o

patrones de comportamiento debajo del mar que puedan afectar a los humanos.

 Recibir un diagnóstico y tratamiento médico hecho por un robot.

 Incrementar la colaboración entre instituciones de gobierno y empresas para generar

inteligencia.

 Hacer ofertas en tiempo real a consumidores dentro de una plaza comercial.


Referencias Bibliográficas

Aguilar, R., Torres, J., y Martín, C. (2019). Aprendizaje Automático en la Identificación de

Sistemas. Un Caso de Estudio en la Predicción de la Generación Eléctrica de un

Parque Eólico, Revista Iberoamericana de Automática e Informática Industrial,

16(1), 114 – 127.

Soto, C. (2018). Aplicación de métodos de aprendizaje automático en el análisis y la

predicción de resultados deportivos, Federación Española de Asociaciones de

Docentes de Educación Física (FEADEF), 34(2), 377 – 382.

Morante, R. (2008, mayo). Etiquetado automático de roles semánticos con un sistema de

aprendizaje basado en memoria. Revista de los Estudios de Humanidades y los

Estudios de Lenguas y Culturas de la UOC. Recuperado de

https://digithum.uoc.edu/10/dt/cat/morante.pdf.

Ortega, C. (s.f.). Cómo las empresas pueden impulsar su negocio a través de las

plataformas E-Commerce con el Big Data, Aprendizaje Automático y el

Management Científico., Quality Excellence S.L., (405), 75 – 86.

Boletín de RedIRIS. (2008). Identificación de aplicaciones de red mediante técnicas de

aprendizaje automático (41). Recuperado de

http://www.rediris.es/difusion/publicaciones/boletin/82-83/ponencia2.2A.pdf.
Tornero, J., (2017). Machine Learning: Modelos Ocultos de Markov (HMM) y Redes

Neuronales Artificiales (ANN) (Tesis de pregrado). Universidad de Barcelona,

Barcelona.

Monleón, A., (2015). El impacto del Big-data en la Sociedad de la Información. Significado

y utilidad. Historia y Comunicación Social. 20(2), 427 – 445.


Gramajo, E., García-Martínez, R., Rossi, B., Claverie, E., Britos, P. y Totongi, A. (s.f.).

Una Visión Global Del Aprendizaje Automático. CAPIS - CENTRO DE

ACTUALIZACION PERMANENTE EN INGENIERIA DE SOFTWARE, 1 – 14.

Fernández, M. (26 de marzo de 2018). ¿Cómo aplicar Machine Learning al entorno

publicitario? [Blog]. Recuperado de https://ipmark.com/noticias-tecnologia-

machine-learning-publicidad/

Urbina, AB., y De la Calleja, J. (2017). Breve reseña de aplicaciones educativas utilizando

minería de datos y aprendizaje automático. Revista Electrónica de Investigación

Educativa, 19 (4), 84 – 86. https://doi.org/10.24320/redie.2017.19.4.1305