Documentos de Académico
Documentos de Profesional
Documentos de Cultura
¿Será posible construir una máquina o robot tan inteligente como el ser humano?
La Inteligencia artificial está tomando cada vez más importancia en nuestra vida
diaria y laboral, ya que, permite la comunicación con nuestros dispositivos como si
ellos también fueran personas. Nuestro teléfono es un asistente personal gracias a
que utiliza procesamiento de lenguaje natural; las redes sociales nos sugieren el
etiquetado de fotos porque tienen técnicas de reconocimiento de imagen, cuando
compramos por internet nos ofrecen recomendaciones de productos basadas en
otras compras que ya hemos realizado anteriormente y cuando nos trasladamos a
un lugar podemos recibir información optimizada del tráfico y navegación en tiempo
real. También, en nuestras tareas laborales, mediante el algoritmo de inteligencia
artificial, minería de datos y big data, podemos predecir la permanencia o ausencia
de nuestros clientes o analizar nuestra cuenta de twitter para conocer la satisfacción
de los clientes con nuestra empresa y nuestros productos. Estamos en la era de la
Inteligencia Artificial, rodeados de máquinas, robots, algoritmos y dispositivos
inteligentes. Usamos un teléfono inteligente y accedemos a las redes sociales que
usan algoritmos de inteligencia artificial.
Por esto, formar parte de los desarrolladores de estas tecnologías, representa una
enorme oportunidad. En este curso aprenderás los fundamentos teóricos de la
inteligencia artificial con sus principales ramas como el aprendizaje automático, el
aprendizaje profundo, la robótica, el procesamiento del lenguaje y los sistemas
expertos. Además, aplicarás los conceptos en la creación de modelos como el de
procesamiento de lenguaje natural, árboles de clasificación y el clasificador
bayesiano. Adicionalmente, aprenderás a utilizar la plataforma de ciencia de datos
llamada RapidMiner, para el diseño y prueba de los modelos.
1. Vamos a comenzar esta sección de Introducción a la Inteligencia Artificial.
2. ¿Recuerdas las preguntas centrales?: ¿Será posible construir una máquina o
robot tan
3. inteligente como el ser humano? ¿Existen actualmente algoritmos inteligentes
4. que sean capaces de tomar decisiones por las personas? A lo largo de esta
sección conocerás
5. más sobre esto. Aprenderás los fundamentos
6. teóricos de la inteligencia artificial, conocerás sus orígenes y evolución, así como
las
7. distintas aplicaciones. Además analizarás sus principales ramas o modelos, como
el aprendizaje
8. automático, aprendizaje profundo, robótica, procesamiento del lenguaje y
sistemas expertos.
9. La inteligencia artificial se encuentra en un auge, gracias al enorme desarrollo
tecnológico
10. que permite mayor rapidez en el procesamiento y mayor capacidad de
almacenamiento, por esto,
11. actualmente podemos contar con una enorme cantidad de datos, que se le ha
llamado el
12. Big Data, gracias a esto, la inteligencia artificial ha podido desarrollarse con mayor
13. rapidez. Otra gran tecnología que ha impulsado la
14. inteligencia artificial es la minería de datos, que está formada por el conjunto de
15. técnicas y algoritmos que permiten el análisis del Big Data, estos algoritmos son
de inteligencia artificial.
16. En esta sección podrás conocer las aplicaciones
17. en diversas áreas como la Logística, transporte, agricultura, salud,
18. ventas al detalle y Educación, entre otras.
19. Además, conocerás los modelos o ramas de inteligencia artificial, como el
aprendizaje
20. automático, aprendizaje profundo, robótica y sistemas expertos
Los orígenes de la inteligencia artificial pueden ser descritos desde diferentes
áreas o nociones, que se han observado de ella a lo largo de todo su
desarrollo durante estos años.
Aunque la noción de máquina está presente desde muchos años atrás, fue
Alan Turing a finales de la II Guerra Mundial, en el año 1950, quien sentó las
primeras bases de la inteligencia artificial, en particular estudió en forma
científica a las máquinas inteligentes. Desde los años 30´s, Alan Turing había
estado trabajando en la teoría de computabilidad y creó una de las primeras
computadoras electromecánicas.
1937 - 1940
1943
1950
1951
1955
1956
1957
1958
1961
1962
1963
1964
1966
1968
1970
En los años 70´s, se crea el primer Robot que comprende el inglés y el primero
que tienen visión y se construye el primer vehículo autónomo. En los años 80
´s, se construye el primer sistema experto y la Inteligencia Artificial se
convierte en ciencia.
1971
1973
1974
1977
1979
1981-1982
1986-1987
1988-1993
1995
1997
2000
2002
2005
2009
2014
Algoritmo genético: método adaptativo que puede usarse para resolver problemas
de búsqueda y optimización.
Sistemas expertos. Son una forma de tecnología de inteligencia artificial que fue
diseñada para resolver problemas complejos tomando decisiones basadas en una
base de conocimiento y reglas para aplicar ese conocimiento.
final.
Aplicaciones en Salud, Biotecnología, las Ventas al detalle y Educación
Salud y Biotecnología
En estas áreas, la inteligencia artificial ayuda a médicos
y pacientes a tener un diagnóstico más rápido y preciso.
Por ejemplo, en la detección del cáncer mediante muestras de sangre en los
pacientes.
El material recolectado tiene una enorme cantidad de datos que necesitan ser
analizados para
encontrar ciertos patrones. La técnica ayuda a identificar los factores
genéticos que podrán conducir el desarrollo o no de una enfermedad.
Una de las técnicas de inteligencia artificial más usadas en las aplicaciones médicas
son los sistemas expertos.
Por ejemplo, el sistema
Athena ayuda a la toma de decisiones de los médicos a la hora de gestionar
pacientes con problemas de hipertensión.
Procesa los datos clínicos de cada paciente
y, gracias a su base de conocimientos sobre hipertensión,
produce una serie de recomendaciones sobre cómo gestionar mejor la atención
clínica personalizada.
Otro ejemplo, es el de los científicos de la universidad de
Carnegie Mellon en colaboración con cuatro hospitales de Chicago.
Han desarrollado un sistema capaz de predecir infartos con cuatro horas de
antelación en enfermos, mejorando en más de tres horas los tiempos de predicción
para los cardiólogos.
Este software fue entrenado con datos de 133 mil pacientes
incorporando 72 parámetros presentes en la historia clínica de los enfermos,
incluyendo signos vitales, edad, glucemia y recuento de plaquetas, entre otros.
Retail o Ventas al detalle
La inteligencia artificial ayuda a realizar predicciones de ventas,
de comportamientos de clientes, de la oferta
de productos y además permite elegir el producto adecuado para recomendar sea
un
cliente en particular, es decir, ofrece un servicio personalizado a los clientes.
Empresas como Amazon utilizan algoritmos para identificar si un libro tendrá o no
éxito,
inclusive antes de su lanzamiento.
Otra excelente aplicación para el sector minorista,
es la optimización del inventario, donde la inteligencia artificial
ayuda a las empresas a prevenir ingresos y determinar cuánto
de un insumo debe adquirirse.
Educación
La inteligencia artificial permite la creación de diferentes tipos de servicios,
por ejemplo, permite identificar si un estudiante está a punto de darse de baja o
reprobar para
entonces sugerir nuevos cursos para un estudiante, nuevas alternativas de pago o
incluso crear ofertas personalizadas para optimizar el aprendizaje y fomentar la
educación.
La inteligencia artificial permite conocer en forma detallada a los
maestros y estudiantes, mediante técnicas de segmentación.
En resumen, permite que se ofrezca una educación personalizada con rutas de
aprendizaje de acuerdo al
perfil del estudiante que se van desarrollando en forma adaptativa.
1. final.
2. Aplicaciones en servicios financieros, manufactura, cadena de suministros,
3. socioeconomía y mercadotecnia
4. Servicios financieros, en esta área los
5. algoritmos de la inteligencia artificial ayuda a las instituciones financieras a
6. identificar los riesgos que un cliente puede representar y hasta predecir
7. patrones del mercado y sus consecuencias así como recomendaciones de operación.
8. Los análisis de transacciones probablemente fraudulentas son un área
9. en la que la inteligencia artificial permite tener éxito.
10. Manufactura y cadena de suministros,
11. las técnicas y algoritmos de la inteligencia artificial ayuda en
12. el análisis de los productos y las piezas que requieren mantenimiento, para
13. predecir los problemas que se podrían presentar en el futuro, esto ayuda a las
14. empresas de manufactura a decidir cuánto comprar o producir así como a predecir
15. impactos y riesgos de proveedores.
16. Socioeconomía, en estas áreas también se
17. usa cada vez más, modelos de inteligencia artificial, principalmente
18. de simulación basada en agentes, un ejemplo, es la simulación de
19. interacciones entre grandes cantidades de agentes y la predicción de los
20. efectos que causaría introducir elementos nuevos en un determinado
21. sistema como por ejemplo los efectos que tendría sobre la movilidad urbana, la
22. construcción de un parque o una zona peatonal o los efectos sobre la economía
23. y la ecología de la construcción de una autovía o un aeropuerto, de esta forma
24. las decisiones sobre dichas actuaciones se pueden tomar con muchas más y mejor
25. información disponible. Otro ejemplo de los robots de conversación que son
26. programas de computadora que usa un conjunto de reglas para conducir una
27. conversación basada en el habla o en el texto con un humano a través de una
28. interfaz de chat en línea. Los robots de conversación son alimentados por la
29. inteligencia artificial y usan la técnica del aprendizaje de máquina para
30. detectar e imitar la conversación humana, se desarrollan comúnmente para
31. proporcionar contenido específico o servicio automatizado o utilidad a los
32. usuarios, también, específicamente el mercadotecnia los sistemas de
33. recomendación son algoritmos filtrados de información basada
34. en inteligencia artificial que puede predecir automáticamente las
35. preferencias del usuario y las respuestas a las consultas basadas en el
36. comportamiento pasado, la relación de un usuario con otros usuarios
37. la simulación entre los elementos comparados y el contexto. Ejemplos de lo
38. antes mencionado son los sistemas de frecuentemente comprado de amazon y el
39. algoritmo de cine match de netflix además estos algoritmos también se
40. utilizan en las redes sociales como facebook y linkedin para encontrar
41. conexiones entre personas y datos e identificar objetivos para las campañas
42. de marketing
Concepto
predicciones basadas en datos, tras lo cual realizan ajustes sin haber sido
entre otras.
Aprendizaje profundo
Robotica
Conceptos
La robótica es la ciencia que estudia los fundamentos de las máquinas capaces
computadora.
La robótica es la ciencia que estudia los robots, y estos son cualquier agente
autónomo que reside en la propia máquina y además son inteligentes ya que tienen
Pepper
Atlas
Insight
Sistemas Expertos
Conceptos
Por ejemplo, un sistema experto en diagnóstico médico, requiere como datos los
síntomas del paciente, los resultados de análisis clínicos y otros hechos relevantes,
y, utilizando estos, busca en una base de datos la información necesaria para poder
identificar la correspondiente enfermedad.
Resumen
Ahora que has leído sobre el tema de inteligencia artificial, reflexiona la respuesta
de la siguiente pregunta: ¿Bajo qué condiciones sería posible construir una máquina o
robot con inteligencia artificial general, que sea tan inteligente como el ser humano?
1. Esta sección trata sobre el procesamiento del lenguaje natural, también conocido como
2. PLN. Que se enfoca en analizar las interacciones entre las computadoras y el lenguaje
humano.
3. En estos contenidos se muestra una introducción al procesamiento del lenguaje natural.
Se
4. describen los conceptos relacionados con el PLN, los tipos y modelos de
procesamientos
5. y las problemáticas relacionados con el análisis del lenguaje en sus formas hablada y
escrita.
6. También se examinan las diferentes técnicas de análisis, en particular el aprendizaje
7. automático. Se muestran las diversas aplicaciones, mostrando un esquema de cómo se
realiza un
8. análisis de sentimiento en twitter y se realizan ejercicios prácticos mediante
herramientas
9. en internet.
10. Además se realiza una práctica paso a paso con el software RapidMiner de análisis de
11. sentimiento en twitter. El procesamiento del lenguaje natural hablado
12. o escrito, es una importante área de desarrollo de la inteligencia artificial. Es esencial
13. comprender que todavía no se logra una exactitud total en la traducción y comprensión
de
14. textos y audios, debido a los problemas de ambigüedad y estructura del lenguaje.
15.
En los videos que verás a continuación, se revisan los niveles, técnicas y modelos
del análisis del lenguaje.
Niveles: morfológico, sintáctico, semántico y pragmático.
Técnicas: lingüísticas formales y probabilísticas.
Modelos: lógicos y probabilísticos.
1. Miren aquí hay otra herramienta que es este tweetmood, aquí está la página a la
2. cual ustedes pueden entrar y les va a aparecer una pantalla como esta que
3. tiene tres opciones voy a hacer yo también lo mismo voy a entrar a esa
4. pantalla que es esta que tenemos aquí y pues aquí igual te da explicación
5. también es un proyecto de investigación y pues te da tres opciones que tú puedes
6. hacer puedes ver métricas acerca de un tuit o
7. de un texto o de una palabra clave puedes comparar dice por ejemplo si tú
8. quieres comparar a políticos o comparar autos por ejemplo marcas pues puedes ver
9. qué tanto se habla que tan positivo es que hablen de uno que hablen del otro te
10. hace una comparación o te da estadísticas acerca de eso, entonces voy
11. a entrar a la primera y aquí nosotros le podemos dar de algún texto
12. por ejemplo el Wolkswagen jetta le dimos le dimos enter y pues aquí te
13. hace un análisis más completo que el anterior pero vean aquí por ejemplo aquí
14. está el análisis del sentimiento en cuestión de porcentaje entonces aquí te
15. dice que hay es un 25% saca una muestra de tweets que sean aquí si son tweets
16. éste va a la base de datos de los tweets y saca este texto y entonces él saca una
17. muestra, una cantidad de tweets los analiza que es la herramienta que vimos
18. hace un momento está también los analiza y bueno está diciendo que un 25%
19. de lo que eran tweets positivos con sentimientos positivo y un 75%
20. que fueron con sentimiento negativo y también hay una cantidad de
21. tweets que sacó con un sentimiento neutral entonces aquí te muestra en
22. valores acá está en porcentaje pero por ejemplo de los tweets que sacó que es
23. una pequeña muestra que extrae pues aquí están los positivos, los negativos
24. y los neutros entonces ahí también te los muestra te lo muestra de esta manera
25. también aquí por ejemplo va subiendo de negativo a positivo son los que están
26. hasta el punto 5 son los tweets negativos y luego después conforme va
27. aumentando son positivos y aquí está los neutros o sea la subjetividad y la
28. objetividad de ellos también te los muestra de esa manera, tú los puedes
29. aquí ir analizando y te muestra los tweets que fue analizando los que
30. extrajo y el análisis que hizo pues fue de estos tweets que están mostrando aquí
31. entonces aquí tenemos otra herramienta que tú puedes utilizar para ir haciendo
32. pues los análisis de sentimiento en twitter y pues es una herramienta que
33. aunque están en investigaciones pues ambas te pueden dar pues unos primeros
34. resultados para ir pensando en un negocio, en un proyecto pues puedes
35. comenzar con algunas de estas herramientas,
36. esto es lo que estuvimos revisando ahorita aquí
37. pues te dejo un ejemplo que es lo mismo que acabamos nosotros de realizar
38. ahorita.
39.
Hay dos tipos de licencias que puedes utilizar en forma gratuita: la licencia
académica, si tienes un correo electrónico de una universidad y, la licencia libre,
que está limitada a 30 días y que la puedes descargar con cualquier correo
electrónico.
1. Vamos a realizar la instalación del Rapid Miner, lo primero que tenemos que
2. hacer es entrar al navegador y aquí vamos a ir a la página del Rapid Miner
3. hacemos la búsqueda entramos a la página entonces vamos a buscar en donde
4. descargar una licencia, hay dos tipos de licencias que nosotros podemos utilizar
5. en este curso la primera es entrar al programa educacional es decir con un
6. correo que nosotros tengamos de una universidad que puede ser de nuestra
7. universidad del anáhuac nosotros podemos bajar una versión que
8. está muy completa y que nos va a durar más tiempo esta versión la podemos usar
9. nosotros para cuestiones académicas nada más le vamos a dar en productos dentro
10. de productos vamos a seleccionar Educational Program vamos a
11. descargarla vamos a darle en comenzar y ahora tenemos aquí la página con los
12. datos que nos pide Rapid Miner el primero es el correo electrónico universitario
13. qué función tienes tú en la universidad nosotros le vamos a dar como estudiantes
14. nombre de la universidad el nombre del curso el número de curso
15. finalización del curso y el nombre del maestro y ahora le vamos a dar descargar
16. como no tenemos una cuenta registrada vamos a registrarnos nosotros
17. seleccionamos venta de tipo educacional ponemos nuestro nombre apellido nuestra
18. dirección de email y vamos a crear nuestro password y le damos en registrar
19. nos han enviado un email y nos dice que tenemos que darle clic para confirmar
20. dentro del email para activar nuestra cuenta entonces vamos a revisar nuestro
21. correo aquí tenemos efectivamente un correo que damos clic y aquí viene y
22. está verificar este correo y le damos clic dice que la cuenta fue creada
23. exitosamente entramos a la pantalla de la licencia educacional aquí nos muestra
24. un mensaje y nos pide información personal
25. entonces seleccionamos un número de teléfono de acuerdo al país le decimos
26. que somos estudiantes le ponemos el correo electrónico que nosotros
27. registramos le ponemos el nombre de la universidad y nos pide una breve
28. descripción para que utilizaremos el Rapid Miner
29. aceptamos las condiciones de la licencia entonces aplicamos aquí te pone un link
30. para descargarlo le vamos a dar click ahí y aquí están
31. ya las opciones dependiendo de tu equipo si entonces le vamos a dar clic en
32. windows 64 bits y empieza a descargar el programa ya terminó la descarga y lo que
33. tenemos que hacer ahora es ir a la carpeta donde está descargado el archivo
34. y aquí está el archivo de instalación del Rapid Miner, vamos a ejecutar ese
35. archivo y ahora sí va a comenzar la instalación te damos siguiente que si
36. estamos de acuerdo en que en qué carpeta lo va a instalar y comienza la
37. instalación
38. bien aquí nos pone la pantalla de que se
39. ha completado y nos dice si queremos abrir inmediatamente el Rapid Miner le
40. damos terminar y aquí ya está abriendo Rapid Miner, nos muestra pantalla de
41. inicio tenemos que aceptar las condiciones y aquí tenemos la pantalla
42. de inicio del Rapid Miner, entonces ya quedó instalado con licencia académica
43. si por alguna razón ustedes no tienen una cuenta de su universidad la opción
44. que tenemos es bajar la versión gratuita son 30 días entonces aquí buscamos la
45. página de Rapid Miner y esta primera opción que dice descargar Rapid Miner el
46. estudio le damos clic aquí y aquí pondrían ustedes su correo electrónico
47. aquí seleccionamos cualquier opción seleccionamos este alguna industria y le
48. daríamos clic en descargar entonces con esto ya tendrían ustedes su versión
49. libre por 30 días
50.
1. Una vez que hemos realizado la instalación del software Rapid Miner
2. vamos a revisar una breve introducción de cómo utilizarlo, entonces aquí vamos
3. a entrar al software, aquí tenemos la pantalla de inicio, una ventana emergente
4. de ayuda se abre y te muestra tres pestañas, tú puedes empezar con alguno de
5. estos archivos una página en blanco o dos herramientas que trae aquí
6. disponibles estas nuevas versiones de Rapid Miner o bien puedes escoger una
7. práctica ya realizada que le llama templates normalmente cuando vamos a
8. empezar a trabajar empezamos con una en blanco o bien puedes continuar tu
9. trabajo abriendo algunos de los archivos más recientes que tú hayas elaborado o
10. puedes ir a la ayuda algún tutorial por ejemplo operadores y procesos
11. aquí tenemos nosotros una pantalla que nos va llevando poco a poco cómo
12. realizar este ejercicio, aquí estamos nosotros en modo tutorial entonces éste
13. pues ya como parte del tutorial te dice que recuperes la base de datos de
14. titanic por ejemplo tú puedes estar trabajando con todo esto tú tienes aquí
15. disponibles diferentes archivos y así tú puedes ir avanzando le das en siguiente
16. y ahora te dice la siguiente actividad buscar en el repositorio y dice que
17. busques en en 'champions' y dice que arrastres titanic training para ir al
18. siguiente paso tú le das en next y ahora te dice que construyas tu primer proceso
19. se conecta la salida del puerto que se llama out
20. este es el control que nosotros acabamos de poner como arrastrando la tabla se
21. creó este operador que se llama retriever y éste tiene este que es un
22. puerto que puede tener conexiones y este puerto se llama auto esta parte que
23. tenemos aquí nosotros es el panel de proceso entonces este puerto nos pide en
24. esta actividad que nosotros lo conectemos a este puerto que se llama
25. rest cómo lo podemos conectar le vamos a y vamos a generar arrastrar la línea y
26. la vamos a soltar aquí este puerto out se conectó con el puerto red y le vamos
27. a dar en siguiente y me dice que la actividad que hay que hacer es darle
28. clic en el botón que es como un play que es el rom le vamos a dar play
29. aquí tenemos ya la ejecución de play que es lo que hizo es mostrar la tabla que
30. nosotros le dijimos que mostrara que era la del titanic training entonces con eso
31. ya estamos ejecutando nosotros el proceso y le voy a dar en siguiente que
32. bueno se ha determinado la práctica que se hizo bien y con esto termina este
33. ejercicio tras ejercicios que vienen aquí tú los puedes utilizar en cualquier
34. momento para ir practicando paso a paso cómo realizar cada una de las
35. operaciones del Rapid Miner otra forma de trabajar es empezar con una página en
36. blanco esta es la pantalla principal esta es la barra de título que me dice
37. la versión del Rapid Miner y en qué computadora está instalada la barra que
38. sigue es una barra de menú aquí está en todas las opciones que nosotros
39. tenemos disponibles para trabajar con el rapid mainer la barra que sigue es una
40. barra de iconos con las tareas más comunes y estos botones son muy
41. importantes estos dos del lado derecho son como herramientas adicionales de
42. ayuda pero estos dos normalmente todos los ejercicios vamos a estar
43. interactuando entre estos dos botones este es el botón de diseño y este es el
44. botón de resultados la parte principal del rapide mainer es toda esta pantalla
45. en la parte central está lo más importante que es el modelo que yo estoy
46. creando es donde yo voy a estar poniendo los operadores las conexiones y es en
47. donde se va a estar ejecutando todo nuestro modelo en la parte de arriba a
48. la izquierda nosotros tenemos diferentes archivos
49. procesos que vamos a ir guardando un proceso tiene este icono y además
50. podemos tener tablas también tienes algunos ejemplos también tienes procesos
51. si tú entras aquí a procesos aquí te dan unas plantillas que tú puedes utilizar
52. para esos procesos igual tú puedes rescatar archivos para subirlos aquí y
53. poderlos trabajar lo que tienes que hacer es importar ese dato vamos a
54. suponer que tú hiciste la tabla en excel entonces le daríamos importar le dices
55. que está en tu computadora y dentro de tu computadora pues tú vas a poder
56. buscar la tabla seleccionas el archivo y le das siguiente al darle siguiente aquí
57. ya está trayendo de hacer una muestra del archivo que estás tú importando le
58. das siguiente te dice los tipos de cada una de las variables le das siguiente y
59. te dice que lo va a almacenar en el repositorio local con el nombre es le
60. das terminar automáticamente te abre la práctica yo me voy a cambiar el diseño
61. entonces aquí este es el archivo que ahorita lo acabo yo de importar cómo
62. puedo ir armando mi proceso el proceso se empieza a llenar de operadores si yo
63. arrastro aquí una tabla automáticamente detecta y da de alta
64. que es el control de triple es un control y los controles tienen puertos y
65. lo que decíamos que tú lo puedes conectar a los puertos de salida como
66. está aquí y luego lo puedes ejecutar qué más puedo hacer bueno hay varios
67. controles que dependiendo de la práctica tú los vas a poder realizar tú vas a ir
68. buscando aquí te aparece y lo vas a arrastrar lo puedes arrastrar aquí para
69. que automáticamente se conecte o lo puedes arrastrar acá afuera y hacer las
70. conexiones manuales entonces por ejemplo vamos a suponer que lo ponemos aquí y
71. vean como automáticamente se conectó si yo es no lo quiero pues lo puedo
72. seleccionar y le puedo dar suprimir y automáticamente se elimina entonces ya
73. aquí tengo yo dos controles y aquí me genera un árbol de decisión hay otros
74. controles por ejemplo el de gaming es un elemento que tú puedes arrastrar y lo
75. puedes soltar soltar aquí y así puedes ir tú teniendo diferentes controles y
76. puedes tener más de una salida de un elemento para conectarlo en la parte
77. del puerto de salida para mostrar los resultados esta ventana que tenemos aquí
78. me va a servir para dar de alta los controles dependiendo del modelo que yo
79. quiero crear para conectarlos simplemente le doy clic y le doy clic en
80. donde lo quiero conectar y se van realizando las conexiones si yo quiero
81. configurar cada uno de estos controles por ejemplo árbol de decisión lo
82. seleccionó estando seleccionado el control del lado derecho tenemos dos
83. elementos importantes en la parte superior tenemos los parámetros del
84. control que esté seleccionado y también tengo la ayuda correspondiente a ese
85. operador y aquí pues yo puedo tener diferentes elementos que dependiendo lo
86. que yo requiera yo voy manipulando cada uno de estos
87. elementos y le voy poniendo la configuración que yo desee y si yo
88. quiero ver la ayuda inclusive te dice si quieres ir a un tutorial como el que
89. vimos al inicio entonces aquí está una ayuda muy detallada de todo lo que tú
90. puedes hacer con este control en la parte superior en los parámetros
91. también es importante notar que tenemos los parámetros por default algunas veces
92. hay parámetros avanzados que están ocultos en este caso le damos clic y me
93. mostró algunos elementos más para que yo pueda configurar si funciona el
94. ejercicio le doy en resultados y aquí me va mostrando los diferentes resultados
95. que yo puedo tener aquí se van a ir abriendo las ventanas aquí te van
96. mostrando en cajitas todos los diferentes resultados y tú le vas dando
97. clic en el que quieres observar entonces me voy a regresar a diseño aquí en esta
98. parte tenemos nuestro repositorio que es donde están todos los archivos en la
99. parte central es donde tú colocas todos los operadores y realizando todas las
100. conexiones esta parte de la parte de los operadores que tú buscas y tú puedes
101. estar insertando a tu modelo para irlo enriqueciendo cuando tú seleccionas un
102. operador del lado derecho están los parámetros que tú puedes configurar en
103. la parte de abajo a la derecha está la del operador que tú hayas seleccionado y
104. este es el botón importante que es el botón de ejecutar el modelo una vez que
105. tú ejecutas el modelo te va a aparecer la pantalla de resultados y tú vas a
106. poder ver las diferentes tablas o elementos que generó la ejecución y en
107. esta parte que es importante que no se te olvide siempre grabar tu modelo
108. entonces aquí lo podemos grabar el proceso me dice que se va a grabar en el
109. repositorio local y aquí le podemos poner el nombre que tú le quieras poner
110. y con eso se va a grabar entonces esta es la forma en que tú puedes comenzar
a
111. trabajar con el Rapid Miner
112.
Resumen
1. Bien, en este vídeo vamos a revisar cómo se lleva a cabo el entrenamiento de los
2. datos y cómo se prueba el modelo que se genera derivado de ese entrenamiento
3. bien para la construcción del modelo de árboles de clasificación se llevan a
4. cabo las siguientes etapas generales la primera es preparación de los datos qué
5. quiere decir que yo tengo las tablas de datos pero no siempre son adecuadas para
6. generar inmediatamente el modelo sino que tienen tengo que hacerles algún
7. tratamiento por ejemplo quitar los nulos los vacíos los blancos seleccionar las
8. tablas las columnas o variables que yo quiero que entren al modelo eliminar las
9. que no necesito entonces hay una serie de operaciones ahí que se le llama
10. preparación de los datos ya que tengo los datos listos y preparados estos
11. datos los tengo que entrenar entonces tengo que llevar a cabo una operación de
12. entrenamiento que es ir aplicando el modelo aplicando el modelo con varios
13. conjuntos de datos para ir ajustando este modelo una vez que ya tengo ese
14. modelo voy a probarlo cómo lo pruebo pues le voy a aplicar el modelo
15. nuevos datos diferentes a los que yo usé en el entrenamiento entonces pruebo el
16. modelo y ya que probé el modelo tengo que evaluarlo es decir con una matriz de
17. confusión yo tengo que ver qué tanta exactitud tiene mi modelo y esto lo
18. puedo observar en esta etapa de evaluar el modelo y finalmente utilizar este
19. este modelo entonces el objetivo es asegurar que los modelos construidos a
20. partir de los datos disponibles funcionan correctamente para nuevos
21. datos que haya que procesar en un futuro es decir asegurar que el modelo es
22. válido y es capaz de ser usado en producción entonces ellos tengo que
23. asegurarme que el modelo que yo genere va a funcionar para cualquier conjunto
24. de datos nuevos no entonces eso es lo que yo tengo que cuidar al construir un
25. modelo ahora la parte de entrenamiento de los datos dice un algoritmo de
26. aprendizaje un modelo debe funcionar correctamente para los datos de prueba o
27. para nuevos datos es decir yo voy a generar un modelo con un conjunto de
28. datos entonces esos datos se les llama datos de prueba
29. una vez que ya tengo el modelo ya digo este es mi modelo lo voy a aplicar a
30. nuevos datos que tienen que ser datos diferentes a los datos que yo utilicé
31. entonces normalmente en esta etapa de entrenamiento yo toda la tabla la ha
32. dividido en dos partes que son datos de prueba y datos nuevos entonces con los
33. datos de prueba hago el entrenamiento para generar el modelo y con esos datos
34. nuevos aplico ese modelo se debe evitar que sea dependiente el modelo de los
35. datos utilizados durante su entrenamiento evitando el problema
36. conocido como sobreentrenamiento entonces yo tengo un conjunto de datos
37. de prueba con el que generó el modelo y para eso es el modelo funciona muy bien
38. y si yo para el nuevo conjunto de datos no funciona bien quiere decir que ya
39. estoy en este problema de sobreentrenamiento porque en mi modelo
40. nada más funciona muy bien para los datos de prueba pero con datos nuevos no
41. funciona entonces dice este problema de sobreentrenamiento consiste en que el
42. modelo sólo responda estrictamente a las propiedades
43. el conjunto de datos de entrenamiento nada más va a funcionar muy bien para
44. los datos de entrenamiento y será incapaz de aplicarse con niveles de
45. aciertos adecuados a otros nuevos conjuntos de datos que puedan aparecer
46. en un futuro entonces eso no es lo que queremos lo que queremos es crear un
47. modelo claro que tengo que utilizar datos y datos para generar ese modelo
48. pero una vez generado ese modelo pues me va a servir para nuevos datos e
49. inclusive va a volver a actualizarse mi modelo de acuerdo a esos nuevos datos
50. proceso de creación y validación del modelo para los algoritmos supervisados
51. es necesario contar con un conjunto de datos de entrenamiento y otro conjunto
52. de datos de prueba entonces yo tengo una tabla de datos que va a entrar aquí esa
53. es mi entrada vamos a suponer son dos mil 201 pasajeros del titanic esa es mi
54. tabla todos esos datos van a entrar aquí entonces yo voy a dividir la tabla en
55. datos de entrenamiento que lo voy a tener aquí y en datos de prueba entonces
56. yo puedo decir el 70 por ciento de esos 201 van a ser datos de entrenamiento y
57. el 30% van a ser datos de prueba entonces con el 70% yo lo meto al
58. algoritmo de aprendizaje que puede ser el árbol de clasificación y con eso me
59. va a generar el modelo es decir nueva a generar el árbol una vez que yo ya tengo
60. generado este árbol voy a utilizar el 70% que mencioné que iba a dejar para
61. prueba que son datos nuevos y con eso voy a aplicarles el modelo y derivado de
62. eso voy a hacer una prueba para ver qué tanta precisión tuvo este modelo
63. entonces así es como está la estructura y aquí lo tenemos dice se utiliza un
64. conjunto de datos de entrenamiento para crear el modelo supervisado entonces
65. aquí tengo yo los datos de entrenamiento que puede ser ese 70% el conjunto de
66. datos de prueba se utiliza para medir la precisión alcanzada por el modelo el 30
67. por ciento restante de los datos lo voy a dejar para las pruebas el modelo se
68. forma mediante la repetición interactiva de entrenamiento y verificación hasta
69. conseguir los niveles de precisión y de capacidad de
70. predicción aceptables entonces yo voy a estar jugando con los datos de
71. entrenamiento aplicando el algoritmo por ejemplo el de árboles de clasificación y
72. voy a generar el modelo y lo voy a ir ajustando y ajustando y ajustando con
73. otro dato con otro dato entonces a esto se le llama estar entrenando entrenando
74. el modelo una vez que ya utilice el 70% de los datos genera un modelo y digo
75. este es el mejor modelo dado estos datos de prueba este es el mejor modelo
76. entonces lo voy a aplicar para unos datos nuevos y voy a evaluar qué tan
77. bueno entonces toda esta fue la etapa de entrenamiento o training y toda esta fue
78. la etapa de prueba que es el testing entonces esto es lo que se hace en la
79. parte de entrenamiento y de prueba ahora bien como divido yo la tabla inicial que
80. es el 100% de los datos como digo estos van a ser para entrenamiento y estos van
81. a ser para la prueba bien dice los conjuntos de datos de entrenamientos de
82. pruebas suelen ser extracciones aleatorias del juego de datos inicial es
83. decir aleatoriamente yo voy a hacer unos actos para pruebas y otros datos
84. para entrenamiento y se en función del número de datos disponibles existen
85. diferentes técnicas para la creación de los dos conjuntos del de entrenamiento y
86. el de prueba entonces por un lado van a ser aleatorias pero por otro lado qué
87. porcentaje se queda en entrenamiento y qué porcentaje se queda en prueba y
88. entonces hay algunas de las más usadas estrategias más usadas dice una parte de
89. la tabla para entrenamiento y la otra para eventos de 70% para entrenamiento y
90. 30% para prueba otra es que vas a dividir la tabla en subconjuntos por
91. ejemplo en cada conjuntos y vas a entrenar los datos con las que menos 11
92. conjuntos y vas a probar el modelo con el último conjunto vamos a suponer que
93. tengo un acá igual a 10 y yo tengo mil registros ahí o sea tengo mil datos de
94. entrada entonces si acá vale 10 yo voy a generar 10 conjuntos de 100
95. datos cada uno y todo lo voy a hacer en forma aleatoria entonces voy a tener yo
96. 10 y cada conjunto va a ser de 100 datos en
97. total tengo mil datos y qué voy a hacer dice voy a entrenar los datos con k
98. menos 1 conjuntos entonces yo tengo 10 más uno con nueve conjuntos yo voy a
99. estar entrenando entrenando entrenando y con el último conjunto el que no utilice
100. con este voy a aprobar aprobar el modelo entonces esa es otra forma de hacerlo
101. otra dice todos los datos menos uno para entrenamiento y si el dato no usado
para
102. prueba entonces yo voy a agarrar todos los datos a excepción de uno y con eso
103. os voy a entrenar el modelo y solamente voy a dejar un dato para realizar la
104. prueba entonces estas son las diferentes formas o técnicas que yo puedo utilizar
105. para dividir la tabla en datos de entrenamiento y datos de prueba
106.
Clasificador bayesiano
En esta unidad, se muestra una introducción al clasificador bayesiano