Los algoritmos de aprendizaje automático pueden aprender asignaciones de datos
de entrada y salida, o de A y B. ¿Cómo se desarrolla un proyecto de aprendizaje automático? En este vídeo, aprenderás lo que es el flujo de trabajo de un proyecto de aprendizaje automático. Veamos. Como ejemplo de trabajo, voy a usar el reconocimiento de voz. Algunos de ustedes podrían tener en casa un dispositivo Amazon Echo o Google Home o Apple Siri o Baidu DuerOS. Hace algunos años, trabajé un poco en un sistema de reconocimiento de voz de Google que después llevó al proyecto DuerOS de Baidu. Hoy tengo un Amazon Echo en mi cocina. Cada vez que voy a cocer un huevo digo: "Alexa, fija el temporizador en tres minutos". Y me informa cuando han pasado los tres minutos y los huevos están listos. ¿Cómo se crea un sistema de reconocimiento de voz que pueda reconocer cuando dices "Alexa", o "Oye, Google", "Hola, Siri" u "Hola, Baidu"? Veamos las fases clave de un proyecto de aprendizaje automático. Por su sencillez, voy a usar el Amazon Echo y detectar las palabras clave de Alexa como ejemplo de trabajo. Si quieres crear un sistema de IA o aprendizaje automático para saber cuándo un usuario ha dicho la palabra "Alexa", el primer paso es reunir datos. Eso significa ir por ahí haciendo que varias personas digan la palabra "Alexa" y grabar el audio. También hacer que otro grupo de personas diga otras palabras como "Hola", o muchas otras palabras y grabar también esos audios. Después de recoger muchos datos de audio, muchos clips de audio de gente diciendo "Alexa" u otras cosas, el segundo paso es entrenar al modelo. Para ello se usa un algoritmo de aprendizaje automático para aprender asignaciones de entrada y salida, o de A a B, en las que la entrada A sería un clip de audio. En el caso del primer clip de audio anterior, es de esperar que te dirá que el usuario dijo "Alexa", y en el caso del clip número dos, a la derecha de la pantalla, con suerte, el sistema aprenderá a reconocer que el usuario ha dicho "Hola". Cuando un equipo IA empieza a entrenar un modelo, es decir, aprender la asignación de A a B o entrada-salida, lo que sucede, casi siempre, es que el primer intento no funciona bien. Invariablemente el equipo tendrá que intentarlo muchas veces, como decimos en IA "iterar" muchas veces. Tienes que iterar muchas veces hasta que, con suerte, el modelo parezca suficientemente bueno. La tercera fase es implementar el modelo. Esto significa que pones este software de IA en un altavoz inteligente real y lo envías a un pequeño grupo de usuarios de prueba o a un gran grupo de usuarios. Lo que sucede con muchos productos de IA cuando los envías es que ves que empieza a recoger nuevos datos y puede que no funcione tan bien como esperabas inicialmente. Por ejemplo, yo soy del Reino Unido y voy a elegir inglés británico. Pero imagina que has entrenado al sistema de reconocimiento de voz con hablantes de acento americano y después envías el altavoz inteligente al Reino Unido y encuentras personas con acento británico que dicen "Alexa". Puede ser que no reconozca la voz tan bien como esperabas. Cuando eso sucede, es de esperar que puedas recoger datos de casos como por ejemplo hablantes de acento británico con los que no ha funcionado tan bien como esperabas, y utilizar estos datos para mantener y actualizar el modelo. En resumen, las etapas clave de un proyecto de aprendizaje automático son recoger datos, entrenar el modelo, la asignación de A a B, y después implementar el modelo. A lo largo de estas etapas a menudo hay mucha iteración, que implica un ajuste fino o adaptación del modelo para que funcione mejor, o recoger nuevos datos incluso después de haberlo enviado, con la intención de mejorar el producto, lo cual será posible o no dependiendo de si eres capaz de obtener nuevos datos. Veamos estas tres etapas y cómo se aplican a un proyecto distinto de creación de un elemento clave de un vehículo autónomo. Recordemos las etapas clave: recoger datos, entrenar el modelo, e implementar el modelo. Vamos a revisar estos pasos en la próxima pantalla. Imaginemos que estás creando un vehículo autónomo. Uno de sus componentes clave es un algoritmo de aprendizaje automático que toma como entrada una foto, por ejemplo, de lo que hay delante del vehículo y te dice donde están los demás vehículos. ¿Cuál es el primer paso para crear este sistema de aprendizaje automático? Si recuerdas la última pantalla el primer paso era recoger datos. Si tu objetivo es disponer de un algoritmo de aprendizaje automático que pueda tomar como entrada una imagen y como salida la posición de otros vehículos, los datos que deberías recoger serían tanto imágenes como la posición de otros vehículos que quieres que el sistema de IA te dé como salida. Imaginemos que empiezas con unas cuantas fotos como estas. Son entradas A al algoritmo de aprendizaje automático. También debes decirle cuál es la salida B que quieres obtener. Para cada una de estas imágenes, dibujarías un rectángulo alrededor de los vehículos que quieres que sean detectados en la foto. En esta pantalla estoy dibujando a mano estos rectángulos, pero en la práctica usarías un software que te permitiera trazar rectángulos perfectos, mejores que estos dibujados a mano. Después de haber generado este conjunto de datos, ¿cuál es el segundo paso? Si recuerdas,, el segundo paso era entrenar el modelo. De forma invariable, cuando los jóvenes ingenieros de IA comienzan a entrenar un modelo, se encuentran con que no funciona muy bien al principio. Por ejemplo, dada esta imagen, quizá el software, en los primeros intentos, piense que esto es un vehículo. Solo tras realizar muchas iteraciones es de esperar que obtengas un resultado mejor; cuando esté claro que el vehículo está realmente ahí. Finalmente, ¿cuál era el tercer paso? Implementar el modelo. Naturalmente, en el mundo del vehículo autónomo, la seguridad es lo más importante y hay que implementar el modelo o probarlo solo de forma que se pueda preservar la seguridad. Pero cuando instalas el software en vehículo en la carretera, puedes encontrar que hay nuevos tipos de vehículos, como carros de golf, que el software no detecta muy bien. Así que obtienes nuevos datos, por ejemplo, fotos de esos carros de golf, y usas esos datos para mantener y actualizar el modelo para que, esperemos, puedas disponer de un software de IA que mejore continuamente hasta el punto en que llegues a tener un software que funcione bien para detectar otros vehículos a partir de fotos como estas. En este vídeo has aprendido cuáles son las etapas clave de un proyecto de aprendizaje automático: recoger datos, entrenar el modelo, e implementar el modelo. A continuación veremos cuáles son las etapas clave o cuál es el proceso de trabajo de un proyecto de ciencia de datos. Continuemos con el siguiente vídeo.