Está en la página 1de 85

Inteligencia Artificial

¿Será posible construir una máquina o robot tan inteligente como el ser humano?

El cerebro humano es tan fascinante como complejo, por lo que, parte de su


funcionamiento sigue siendo un misterio para los investigadores. Los seres
humanos somos inteligentes y eso nos hace diferentes a los demás. a las máquinas,
a los robots y a las cosas La Inteligencia Artificial permite crear dispositivos o
algoritmos que sean capaces de comportarse como un ser humano, con inteligencia
propia, lo cual implica que deben tener las capacidades para percibir el entorno,
realizar tareas y tomar decisiones en forma exitosa.

La Inteligencia artificial está tomando cada vez más importancia en nuestra vida
diaria y laboral, ya que, permite la comunicación con nuestros dispositivos como si
ellos también fueran personas. Nuestro teléfono es un asistente personal gracias a
que utiliza procesamiento de lenguaje natural; las redes sociales nos sugieren el
etiquetado de fotos porque tienen técnicas de reconocimiento de imagen, cuando
compramos por internet nos ofrecen recomendaciones de productos basadas en
otras compras que ya hemos realizado anteriormente y cuando nos trasladamos a
un lugar podemos recibir información optimizada del tráfico y navegación en tiempo
real. También, en nuestras tareas laborales, mediante el algoritmo de inteligencia
artificial, minería de datos y big data, podemos predecir la permanencia o ausencia
de nuestros clientes o analizar nuestra cuenta de twitter para conocer la satisfacción
de los clientes con nuestra empresa y nuestros productos. Estamos en la era de la
Inteligencia Artificial, rodeados de máquinas, robots, algoritmos y dispositivos
inteligentes. Usamos un teléfono inteligente y accedemos a las redes sociales que
usan algoritmos de inteligencia artificial.

Por esto, formar parte de los desarrolladores de estas tecnologías, representa una
enorme oportunidad. En este curso aprenderás los fundamentos teóricos de la
inteligencia artificial con sus principales ramas como el aprendizaje automático, el
aprendizaje profundo, la robótica, el procesamiento del lenguaje y los sistemas
expertos. Además, aplicarás los conceptos en la creación de modelos como el de
procesamiento de lenguaje natural, árboles de clasificación y el clasificador
bayesiano. Adicionalmente, aprenderás a utilizar la plataforma de ciencia de datos
llamada RapidMiner, para el diseño y prueba de los modelos.
1. Vamos a comenzar esta sección de Introducción a la Inteligencia Artificial.
2. ¿Recuerdas las preguntas centrales?: ¿Será posible construir una máquina o
robot tan
3. inteligente como el ser humano? ¿Existen actualmente algoritmos inteligentes
4. que sean capaces de tomar decisiones por las personas? A lo largo de esta
sección conocerás
5. más sobre esto. Aprenderás los fundamentos
6. teóricos de la inteligencia artificial, conocerás sus orígenes y evolución, así como
las
7. distintas aplicaciones. Además analizarás sus principales ramas o modelos, como
el aprendizaje
8. automático, aprendizaje profundo, robótica, procesamiento del lenguaje y
sistemas expertos.
9. La inteligencia artificial se encuentra en un auge, gracias al enorme desarrollo
tecnológico
10. que permite mayor rapidez en el procesamiento y mayor capacidad de
almacenamiento, por esto,
11. actualmente podemos contar con una enorme cantidad de datos, que se le ha
llamado el
12. Big Data, gracias a esto, la inteligencia artificial ha podido desarrollarse con mayor
13. rapidez. Otra gran tecnología que ha impulsado la
14. inteligencia artificial es la minería de datos, que está formada por el conjunto de
15. técnicas y algoritmos que permiten el análisis del Big Data, estos algoritmos son
de inteligencia artificial.
16. En esta sección podrás conocer las aplicaciones
17. en diversas áreas como la Logística, transporte, agricultura, salud,
18. ventas al detalle y Educación, entre otras.
19. Además, conocerás los modelos o ramas de inteligencia artificial, como el
aprendizaje
20. automático, aprendizaje profundo, robótica y sistemas expertos
Los orígenes de la inteligencia artificial pueden ser descritos desde diferentes
áreas o nociones, que se han observado de ella a lo largo de todo su
desarrollo durante estos años.

Se puede considerar como el inicio formal en el año 1950, porque desde


entonces se consideró la intención de dotar de recursos a las máquinas, para
que fueran capaces de resolver problemas sin el apoyo del ser humano, esto
es, de manera autónoma.

Aunque la noción de máquina está presente desde muchos años atrás, fue
Alan Turing a finales de la II Guerra Mundial, en el año 1950, quien sentó las
primeras bases de la inteligencia artificial, en particular estudió en forma
científica a las máquinas inteligentes. Desde los años 30´s, Alan Turing había
estado trabajando en la teoría de computabilidad y creó una de las primeras
computadoras electromecánicas.

Años después, junto con Alan Turing, diversos investigadores le confieren


existencia formal al área de exploración y estudio de estas materias. Entre
ellos podemos mencionar a los siguientes: McCarthy, Minsky, Edmonds,
Papert y Carbonell, entre otros.

1937 - 1940
1943

1950

1951

1955
1956

1957

1958
1961

1962

1963
1964

1966

1968
1970

Después de las aportaciones de Alan Turing, McCarthy y Minsky, entre otros, a


partir del año 1971, la inteligencia artificial se comenzó a desarrollar en el mundo,
gracias a diversas aportaciones muy importantes de investigadores de diversos
países.

En los años 70´s, se crea el primer Robot que comprende el inglés y el primero
que tienen visión y se construye el primer vehículo autónomo. En los años 80
´s, se construye el primer sistema experto y la Inteligencia Artificial se
convierte en ciencia.

Después de una etapa difícil en su desarrollo, a partir de los años 90´s se


logran importantes avances, como el prototipo del robot NAO, los sistemas
que detectan emociones e interactúan con niños autistas y el chatbot Eugene.
Esta época de los años 90’s se conoce como la edad de oro de la Inteligencia
Artificial, ya que las empresas comienzan a invertir en tecnología creando el
llamado mundo digital, en el que se mejoró la capacidad de procesamiento y
análisis de enormes cantidades de datos.

Una etapa cúspide de la Inteligencia Artificial se presentó cuando IBM


lanzó la computadora Deep Blue, que fue capaz de ganar a Gari
Kasparov, campeón del mundo de ajedrez. Este acontecimiento, puso
a la Inteligencia Artificial como protagonista del mundo tecnológico.

1971

1973

1974
1977

1979

1981-1982
1986-1987

1988-1993
1995

1997
2000

2002

2005
2009

2014

Después de la época de oro de la Inteligencia Artificial, en los últimos


años, la inteligencia artificial ha sido potenciada por diversos factores, tales
como la transformación digital que representa una nueva transformación
de las empresas hacia el desarrollo tecnológico con la finalidad de lograr
sus ventajas competitivas y mantenerse como líderes en los mercados
cambiantes y altamente competitivos.

Esta transformación digital está generando una enorme cantidad de datos


que no es posible analizarlos con las herramientas y algoritmos que
tradicionalmente se utilizan con las bases de datos.

Por eso, la inteligencia artificial, el big data y la minería de datos, han


permitido el desarrollo de algoritmos sofisticados de inteligencia artificial,
que están permitiendo a las empresas tomar decisiones basadas en datos
y a los ciudadanos les está ofreciendo la comodidad e inmediatez de la
información para sus actividades diarias.

Entre las aplicaciones más representativas e impactantes que actualmente


se utilizan, se encuentran los asistentes por voz Siri, Cortana, Alexa, Bixby
y muchos otros. Todos ellos utilizan técnicas de procesamiento de
lenguaje natural.

Google Search, Google Maps y Netflix utilizan algoritmos de inteligencia


artificial. También, en las redes sociales como Facebook, Pinterest y
Fotos de Google, los algoritmos de inteligencia artificial permiten el
reconocimiento facial, esto es, la visión por computadora.

En las empresas, la robótica, los sistemas expertos y el aprendizaje de


máquina, están revolucionando los procesos, permitiendo a las empresas
la innovación en sus negocios.

Se están desarrollando herramientas que son plataformas de ciencia de


datos que permiten la aplicación de los algoritmos de inteligencia artificial.
Algunas plataformas son el RapidMiner, Anaconda, Python. Asimismo
Watson, es la plataforma de IBM que integra el aprendizaje automático
para automatizar el ciclo de vida de la IA.

Según Hanio Morillo, experta en Inteligencia Artificial de Google, el


mundo será IA First, es decir, estará liderado y mediado por la inteligencia
artificial, asegura que actualmente ya lo es para Google. Menciona que los
gigantes como Google, Microsoft, Facebook, Amazon, Oracle están
comprometidos con la inteligencia artificial, porque esta tecnología está
cada vez más presente en el día a día de todos, en lo que hacemos, en lo
que elegimos; y en las decisiones de grandes empresas, de salud pública,
de seguridad o de finanzas.

“La inteligencia artificial está evolucionando, estamos


en un momento histórico muy importante: por primera
vez, tenemos un gran poder computacional y una
grandísima cantidad de datos. Cuando ambos se
combinan, el resultado es asombroso porque podemos
utilizar esos datos de una forma beneficiosa para el
usuario.” Asentó Morillo.

En el futuro se vislumbra que se continuará con las investigaciones para el


desarrollo de una inteligencia artificial general, más que especializada, es
decir, una inteligencia más apegada al ser humano, lo cual es muy difícil
de lograr.

Asimismo, se seguirán desarrollando aplicaciones relacionadas con la


web, los videojuegos y los robots autónomos (vehículos autónomos, robots
sociales, robots para la exploración de planetas, etc.).

También las aplicaciones para el medioambiente y el ahorro energético


serán importantes, así como para la economía, la sociología y el arte.

Se desarrollará con mayor profundidad el massive data-driven AI, es


decir, la inteligencia artificial con datos masivos, esto es, la explotación de
cantidades masivas de datos y para procesarlos con hardware cada vez
más rápido con el fin de descubrir relaciones entre ellos, detectar patrones
y realizar inferencias y aprendizaje mediante modelos probabilísticos.

El automóvil autónomo también está enriquecido con nuevas


investigaciones, prototipos y pruebas. Se han realizado diversos
experimentos y se han registrado algunos accidentes fatales. Pero las
investigaciones continúan y los expertos aseguran que será una tecnología
que estará al alcance de nuestras manos en un futuro cercano.
Glosario

Algoritmo: conjunto ordenado de operaciones sistemáticas que permite hacer un


cálculo y hallar la solución de un tipo de problemas.

Algoritmo genético: método adaptativo que puede usarse para resolver problemas
de búsqueda y optimización.

Aprendizaje automático: es una rama dentro de la inteligencia artificial, cuyo campo


de estudio proporciona a las computadoras la capacidad de aprender sin haber sido
explícitamente programadas para ello.

Aprendizaje no supervisado: es un tipo de aprendizaje automático en el que el


algoritmo no recibe información sobre cómo deben ser los datos de salida.
Simplemente se le proporciona como entrada un conjunto de datos no
estructurados, en el que él deberá identificar los posibles patrones y relaciones
existentes entre ellos, para descubrir, por sí solo, una estructura.

Aprendizaje profundo: trata de imitar el funcionamiento del sistema nervioso


humano, para ello, utiliza lo que se conoce como redes neuronales o capas de
unidades de procesamiento (neuronas artificiales) que se especializan en identificar
características o patrones determinados en objetos o conjuntos de datos no
estructurados, sin necesidad de un entrenamiento previo con un conjunto de datos
estructurados o etiquetados.

Aprendizaje supervisado: en este tipo de aprendizaje automático el algoritmo sí


recibe previamente información sobre la relaciones existentes entre los datos de
entrada y salida y sobre cómo deben ser estos últimos.

Autonomía: los dispositivos con inteligencia artificial aplican el término "autónomo"


cuando no necesitan ayuda de las personas; esa autonomía se clasifica en
diferentes niveles. Los coches autónomos, por ejemplo, alcanzan un nivel 4 de
autonomía cuando no necesitan una persona para funcionar a plena capacidad y
por tanto no tienen volante ni pedales.

Chatbot/bot: es un sistema capaz de mantener un diálogo con los usuarios basado


en conversaciones que han sido creadas en secuencia de comandos. Su función es
responder con la máxima relevancia a las preguntas que frecuentemente hacen los
usuarios de Internet, clientes o personal.
Inteligencia artificial: campo de las Ciencias de la Computación que estudia el
desarrollo de un comportamiento aparentemente inteligente en agentes o
dispositivos que perciben su entorno y llevan a cabo acciones que maximizan sus
oportunidades de éxito en la consecución de algún objetivo.

Inteligencia artificial débil: es la ciencia e ingeniería que permite diseñar y programar


ordenadores de forma que realicen tareas que requieren inteligencia.

Inteligencia artificial fuerte: es la ciencia e ingeniería que permite replicar la


inteligencia humana mediante máquinas.

Modelo: un modelo es un algoritmo de aprendizaje automático que construye su


propia comprensión de un tema, o su propio «modelo» del mundo.

Procesamiento del lenguaje natural: software para entender la intención y las


relaciones de las ideas dentro del lenguaje.

Prueba de Turing: consiste en evaluar la capacidad de una máquina para imitar a un


ser humano en la medida en que es indistinguible de una persona de carne y hueso.
Es el medio más válido para juzgar el nivel de inteligencia artificial alcanzado por
una máquina.

Sistemas expertos. Son una forma de tecnología de inteligencia artificial que fue
diseñada para resolver problemas complejos tomando decisiones basadas en una
base de conocimiento y reglas para aplicar ese conocimiento.

Visión por computadora. Área de investigación dentro de la IA que explora el


reconocimiento y comprensión de imágenes y vídeo.

A continuación, se describen las diferentes aplicaciones de la inteligencia


artificial. Se muestran en particular las que se han llevado a cabo en las
áreas de logística, transporte y agricultura. Asimismo, se muestran
las aplicaciones más comunes en general.

1. Aplicaciones en logística transporte y agricultura la inteligencia artificial


2. es tan potente que sus aplicaciones son variadas y extensas por mencionar
3. algunos ejemplos los sistemas de inyección de gasolina en nuestros
4. automóviles están diseñados utilizando algoritmos genéticos así como las
5. turbinas de los aviones a reacción
6. además en el metro de hong kong durante
7. la noche los ingenieros llevan a cabo trabajos de mantenimiento que han sido
8. programados con un software de planeación la detección automática de
9. transportación fraudulentas de tarjetas de crédito se realiza mediante
10. algoritmos de aprendizaje automático también el enrutamiento de las llamadas
11. de teléfonos móviles se basa en una inteligencia artificial
12. la detección de hábitos de consumo se basa en el análisis automático de grandes
13. cantidades de datos mediante algoritmos de aprendizaje automático
14. asimismo la aplicación de la inteligencia artificial está presente en los sistemas de
15. traducción automatizada mediante la cual se utilizan algoritmos para traducir
16. texto o audio de un idioma a otro
17. por ejemplo del ruso al inglés
18. además de sustituir simplemente una palabra por otra
19. puede incorporar técnicas estadísticas que aumentan la probabilidad de identificar
20. correctamente las frases expresiones idiomáticas nombres propios y otras anomalías
21. a continuación te describo algunas aplicaciones en la logística
22. transporte y agricultura
23. Logística y transporte
24. en ciertas ciudades como mountain view de california
25. es común ver autos automáticos recorriendo en las
26. calles cada día
27. es muy probable que en los próximos años sea normal encontrar
28. estos vehículos circulando en todo el mundo
29. además los trenes autobuses y
30. otros medios de transporte también pueden ser conducidos de forma automática.
31. Existen 5 niveles de autonomía
32. los autos autónomos más
33. avanzados actualmente están en el nivel 3 lo que significa que el auto puede
34. manejarse al volante y los pedales asimismo como estar atento al entorno
35. pero depende del complemento de la supervisión humana
36. a partir de 2020 se cree que se logrará al nivel 4
37. en el que solo en algunas ocasiones específicas
38. requerirá intervención humana
39. grandes empresas de comercio electrónico están
40. realizando pruebas para entregar sus productos en estos medios inclusive
41. mediante drones
42. sin embargo el camino es complejo
43. han existido fallas
44. google en el 2016 reportó 400 fallas en sus pruebas
45. que obligaron a desconectar el piloto automático
46. nissan reportó también 400 y mercedes benz más de mil veces en solamente unos
47. 3.000 kilómetros unas 500 por fallo técnico y el resto por decisión del
48. conductor que expresó no sentirse cómodo en decenas de estos casos se evitaron
49. accidentes gracias a la intervención del conductor humano
50. por último en los autos completamente autónomos otra dificultad no técnica vendrá por
aspectos
51. relacionados con la responsabilidad legal
52. en caso de accidentes
53. ¿Quien será el responsable?
54. la respuesta no es evidente y quizás será necesario
55. equipar los coches con cajas negras similares a las de los aviones con el
56. fin de poder definir responsabilidades
57. también será imprescindible reflexionar
58. sobre aspectos éticos por ejemplo en el software de un auto completamente
59. autónomo se tendrá que haber previsto que hacer ante alternativas como por
60. ejemplo salvar la vida de los pasajeros o de otras personas
61. agricultura
62. en esta área la inteligencia artificial se utiliza con la finalidad de simplificar
63. y acelerar la toma de decisiones de un ingeniero agrónomo quien debe saber
64. cuándo es el mejor momento para sembrar y cosechar además qué insumos debe
65. utilizar ya existen plataformas específicas en el mercado para la
66. industria de la agricultura que analizan el tipo de suelo semillas y clima para
67. seguir la mejor mezcla para lograr el éxito de la cosecha
68.

Se revisan los sistemas de detección de cáncer, la identificación de la


genética y el análisis de la hipertensión. También se revisan las
predicciones de ventas, de comportamiento de clientes y oferta de
productos. En Educación se describe el aprendizaje adaptativo.

final.
Aplicaciones en Salud, Biotecnología, las Ventas al detalle y Educación
Salud y Biotecnología
En estas áreas, la inteligencia artificial ayuda a médicos
y pacientes a tener un diagnóstico más rápido y preciso.
Por ejemplo, en la detección del cáncer mediante muestras de sangre en los
pacientes.
El material recolectado tiene una enorme cantidad de datos que necesitan ser
analizados para
encontrar ciertos patrones. La técnica ayuda a identificar los factores
genéticos que podrán conducir el desarrollo o no de una enfermedad.
Una de las técnicas de inteligencia artificial más usadas en las aplicaciones médicas
son los sistemas expertos.
Por ejemplo, el sistema
Athena ayuda a la toma de decisiones de los médicos a la hora de gestionar
pacientes con problemas de hipertensión.
Procesa los datos clínicos de cada paciente
y, gracias a su base de conocimientos sobre hipertensión,
produce una serie de recomendaciones sobre cómo gestionar mejor la atención
clínica personalizada.
Otro ejemplo, es el de los científicos de la universidad de
Carnegie Mellon en colaboración con cuatro hospitales de Chicago.
Han desarrollado un sistema capaz de predecir infartos con cuatro horas de
antelación en enfermos, mejorando en más de tres horas los tiempos de predicción
para los cardiólogos.
Este software fue entrenado con datos de 133 mil pacientes
incorporando 72 parámetros presentes en la historia clínica de los enfermos,
incluyendo signos vitales, edad, glucemia y recuento de plaquetas, entre otros.
Retail o Ventas al detalle
La inteligencia artificial ayuda a realizar predicciones de ventas,
de comportamientos de clientes, de la oferta
de productos y además permite elegir el producto adecuado para recomendar sea
un
cliente en particular, es decir, ofrece un servicio personalizado a los clientes.
Empresas como Amazon utilizan algoritmos para identificar si un libro tendrá o no
éxito,
inclusive antes de su lanzamiento.
Otra excelente aplicación para el sector minorista,
es la optimización del inventario, donde la inteligencia artificial
ayuda a las empresas a prevenir ingresos y determinar cuánto
de un insumo debe adquirirse.
Educación
La inteligencia artificial permite la creación de diferentes tipos de servicios,
por ejemplo, permite identificar si un estudiante está a punto de darse de baja o
reprobar para
entonces sugerir nuevos cursos para un estudiante, nuevas alternativas de pago o
incluso crear ofertas personalizadas para optimizar el aprendizaje y fomentar la
educación.
La inteligencia artificial permite conocer en forma detallada a los
maestros y estudiantes, mediante técnicas de segmentación.
En resumen, permite que se ofrezca una educación personalizada con rutas de
aprendizaje de acuerdo al
perfil del estudiante que se van desarrollando en forma adaptativa.

Aquí se describen las aplicaciones de la inteligencia artificial en las áreas


del Entretenimiento y la Industria Aeroespacial. Se revisan los
videojuegos, el software Watson, los asistentes personales virtuales, los
planeadores de viajes y los robots que ha enviado la NASA a Marte.

1. Aplicaciones de entretenimiento y la industria aerospacial


2. Entretenimiento
3. videojuegos
4. existen videojuegos que utilizan técnicas de
5. inteligencia artificial tales como el ajedrez las damas y los juegos de
6. combate o estrategia
7. hay videojuegos en las que el jugador compite con agentes
8. inteligentes los llamados none player characters
9. que son personajes animados
10. presentes en el juego que el jugador no controla,
11. los npc tienen que desplazarse
12. de un lugar a otro evitando obstáculos y tienen que tomar decisiones acerca de
13. cuál de sus posibles acciones es la más adecuada en función del contexto
14. entre las técnicas de inteligencia artificial que usan estos videojuegos
15. tenemos la búsqueda heurística
16. la planificación
17. las redes neuronales
18. los sistemas deductivos basado en reglas
19. y el aprendizaje de tácticas e incluso
20. estrategias para adaptarse a las habilidades de cada jugador
21. Watson
22. es un programa desarrollado por ibm
23. que ganó el concurso de Jeopardy
24. que consiste en dar respuestas a preguntas
25. de cultura general
26. Watson
27. ganó a brillantes contrincantes humanos
28. en forma clara con las mismas reglas de
29. juego de los jugadores humanos
30. Asistentes personales virtuales
31. En los próximos años los bancos tendrán empleados digitales ayudándonos a
32. realizar las operaciones y además para responder a nuestras preguntas
33. agilizando así la atención al público
34. por ejemplo
35. siri que fue desarrollada para los iphones de apple
36. se comunica mediante el
37. habla escucha las preguntas del usuario y responde, recomienda y realiza acciones
38. mediante los servicios web por ejemplo encontrar un restaurante cercano o
39. compraron las entradas de cine además ofrece una interacción conversacional
40. con otras aplicaciones como los recordatorios,
41. el estado del tiempo,
42. la bolsa,
43. la mensajería,
44. el correo electrónico,
45. el calendario,
46. los contactos
47. las notas,
48. la música,
49. el reloj,
50. el navegador web y los mapas
51. Siri también puede devolver llamadas, leer los mensajes del buzón de voz etcétera
52. y dispone de soporte en varios idiomas
53. los datos que son utilizados por Siri
54. son muy extensos siri utiliza conexiones de alta velocidad para reconocimiento de
55. voz e integra a otros proveedores de información consultando fuentes como
56. bing, wikipedia y twitter sobre preguntas concretas puede incluso conectarse a
57. The New York times
58. Planeadores de viaje
59. mediante apoyo virtual también será
60. posible organizar mejores viajes de vacaciones por ejemplo planeando y
61. programando los detalles tales como vuelos hoteles y traslados
62. Industria Aerospacial
63. Los robots viajan al espacio desde el año 1997 en ese entonces la
64. nasa envió al robot Sojourner de 65 centímetros de largo 48 de ancho y 30 de
65. alto con un peso de 10 kilogramos estuvo 83 días en marte
66. Después se enviaron a los robots Spirit, Opportunity y Curiosity
67.

En la presente informacion se describen las aplicaciones de la inteligencia


artificial en las áreas de los Servicios Financieros, Manufactura,
Cadena de Suministro, Socioeconomía y Mercadotecnia.
Se revisan las simulaciones que se utilizan para apoyar el crecimiento
urbano, los sistemas de recomendaciones y los análisis de transacciones
fraudulentas, entre otros.

1. final.
2. Aplicaciones en servicios financieros, manufactura, cadena de suministros,
3. socioeconomía y mercadotecnia
4. Servicios financieros, en esta área los
5. algoritmos de la inteligencia artificial ayuda a las instituciones financieras a
6. identificar los riesgos que un cliente puede representar y hasta predecir
7. patrones del mercado y sus consecuencias así como recomendaciones de operación.
8. Los análisis de transacciones probablemente fraudulentas son un área
9. en la que la inteligencia artificial permite tener éxito.
10. Manufactura y cadena de suministros,
11. las técnicas y algoritmos de la inteligencia artificial ayuda en
12. el análisis de los productos y las piezas que requieren mantenimiento, para
13. predecir los problemas que se podrían presentar en el futuro, esto ayuda a las
14. empresas de manufactura a decidir cuánto comprar o producir así como a predecir
15. impactos y riesgos de proveedores.
16. Socioeconomía, en estas áreas también se
17. usa cada vez más, modelos de inteligencia artificial, principalmente
18. de simulación basada en agentes, un ejemplo, es la simulación de
19. interacciones entre grandes cantidades de agentes y la predicción de los
20. efectos que causaría introducir elementos nuevos en un determinado
21. sistema como por ejemplo los efectos que tendría sobre la movilidad urbana, la
22. construcción de un parque o una zona peatonal o los efectos sobre la economía
23. y la ecología de la construcción de una autovía o un aeropuerto, de esta forma
24. las decisiones sobre dichas actuaciones se pueden tomar con muchas más y mejor
25. información disponible. Otro ejemplo de los robots de conversación que son
26. programas de computadora que usa un conjunto de reglas para conducir una
27. conversación basada en el habla o en el texto con un humano a través de una
28. interfaz de chat en línea. Los robots de conversación son alimentados por la
29. inteligencia artificial y usan la técnica del aprendizaje de máquina para
30. detectar e imitar la conversación humana, se desarrollan comúnmente para
31. proporcionar contenido específico o servicio automatizado o utilidad a los
32. usuarios, también, específicamente el mercadotecnia los sistemas de
33. recomendación son algoritmos filtrados de información basada
34. en inteligencia artificial que puede predecir automáticamente las
35. preferencias del usuario y las respuestas a las consultas basadas en el
36. comportamiento pasado, la relación de un usuario con otros usuarios
37. la simulación entre los elementos comparados y el contexto. Ejemplos de lo
38. antes mencionado son los sistemas de frecuentemente comprado de amazon y el
39. algoritmo de cine match de netflix además estos algoritmos también se
40. utilizan en las redes sociales como facebook y linkedin para encontrar
41. conexiones entre personas y datos e identificar objetivos para las campañas
42. de marketing

En la presente unidad, se describe el aprendizaje automático o aprendizaje de

máquina. Se revisan sus conceptos y su fundamento. Asimismo, se analizan los

diferentes tipos de algoritmos.

Concepto

El aprendizaje automático es una rama de la inteligencia artificial que también es

conocido como aprendizaje de máquinas (machine learning en inglés). Se enfoca

en crear técnicas y algoritmos para que las computadoras aprendan.

El aprendizaje automático es el proceso por el cual las computadoras desarrollan el

reconocimiento de patrones o la capacidad de aprender continuamente y hacer

predicciones basadas en datos, tras lo cual realizan ajustes sin haber sido

programados específicamente para ello.

El aprendizaje de máquinas, consiste en la implementación de procedimientos que

le permiten a las máquinas mejorar su rendimiento a través de la búsqueda de

patrones que permitan predecir futuras conductas.

Como forma de inteligencia artificial, el aprendizaje automático automatiza el


proceso de creación de modelos analíticos y permite que las máquinas se adapten a
nuevas situaciones de manera independiente.
Se aplica en análisis financieros, reconocimiento de lenguaje, los videojuegos,

detección de fraudes, en medicina y en algoritmos de búsquedas de datos,

entre otras.

Algunos ejemplos de estos tipos de algoritmos son los árboles de clasificación,

segmentación k.means, reglas de asociación y clasificador bayesiano entre otros.

Por ejemplo, las noticias de Facebook, utilizan un algoritmo con aprendizaje

automático para personalizar las noticias que se muestran a cada usuario. Si tu

detienes frecuentemente tu desplazamiento para leer o darle “like” a las


publicaciones de un amigo en particular, las noticias empezarán a mostrarte más

actividad de ese amigo. En caso de que ya no te detengas a leer, darle “like” o

comentar a tu amigo, las noticias se ajustarán en consecuencia.


1. La historia, cuando surgió este concepto durante los años sesentas y setentas, su
2. enfoque era principalmente hacia el uso de las redes neuronales artificiales que
3. servían para aprender a clasificar datos, no se le daba tanta importancia en el
4. ámbito de la investigación en inteligencia artificial sin embargo a
5. partir de los años 80 se empezaron a desarrollar nuevos métodos de
6. aprendizaje que lo convirtieron en una de las áreas más activas de la
7. inteligencia artificial. El método de aprendizaje más conocido a partir de
8. esta década es el aprendizaje inductivo de árboles de decisión. Fundamento, la
9. mayoría de los métodos de aprendizaje automático infieren hipótesis a partir
10. de datos, dichas inferencias son inductivas contrariamente a las
11. inferencias deductivas típicas de la lógica matemática. El razonamiento
12. inductivo va de lo particular a lo general el contraste es que las
13. inferencias deductivas son consecuencia lógica
14. de un conjunto de premisas y por lo tanto son conclusiones falseables
15. mientras que las inferencias inductivas son solamente hipótesis susceptibles de
16. ser falseadas según se vayan conociendo datos adicionales es decir, las premisas
17. apoyan la conclusión pero no la garantizan, un ejemplo típico es el
18. siguiente, si un conjunto de datos sobre pájaros solo contiene información sobre
19. pájaros blancos entonces la hipótesis a la que llegaría un algoritmo de
20. aprendizaje inductivo es que todos los pájaros son blancos, si más adelante se
21. proporcionan datos adicionales que contienen información sobre pájaros
22. negros entonces la hipótesis anterior queda falseada. Tipos de algoritmos,
23. aprendizaje supervisado, en los algoritmos de aprendizaje supervisado se
24. dispone de un conjunto de datos de entrenamiento que permiten aprender para
25. generar el modelo. En el caso de un algoritmo
26. aprenda a clasificar, el conjunto de datos de entrenamiento consiste en datos
27. de los que se conoce a qué clase pertenecen y esta información que le dan
28. estos datos ya clasificados permiten aprender para generar un modelo por
29. ejemplo el árbol de clasificación a partir del cual poder clasificar nuevos
30. datos cuya clase es inicialmente desconocida. En el diseño del modelo es
31. necesario seleccionar o etiquetar la variable o dato que se desea fijar o
32. predecir, los datos son separados en la etapa de entrenamiento y la de prueba
33. la primera es para crear el modelo de acuerdo con el comportamiento de los
34. datos y la segunda es para probar el modelo construido y para evaluarlo
35. Aprendizaje no supervisado, en este tipo de algoritmos no se tiene la información
36. sobre la clasificación de los datos por lo tanto en este caso el sistema tiene
37. que ser capaz de reconocer patrones para poder clasificar las nuevas
38. entradas es decir, no se dispone de un conjunto de datos de entrenamiento que
39. permitan aprender para generar el modelo. En el diseño del modelo no se
40. seleccionan o etiquetas variables y los datos no son separados en la etapa de
41. entrenamiento y la de prueba. Aprendizaje por refuerzo, los algoritmos de
42. aprendizaje por refuerzo se pueden considerar que se sitúan entre los
43. supervisados y los no supervisados en el aprendizaje por refuerzo, un agente
44. aprende mediante la interacción con su entorno en particular a partir de las
45. consecuencias de acciones que se seleccionan ya sea según su experiencia
46. previa que es la explotación de lo ya aprendido o según la selección aleatoria
47. de las acciones posibles en cada situación mediante un proceso de prueba
48. y error. El agente recibe un valor numérico
49. llamado refuerzo que puede ser positivo o negativo, éste codifica el éxito o
50. fracaso de las acciones el objetivo de la gente es seleccionar
51. aquellas acciones que maximizan el refuerzo acumulado, no es aprendizaje
52. supervisado porque no se proporcionan datos correctos de pares estado acción
53. pero tampoco es completamente no supervisado pues el agente recibe un
54. valor de refuerzo que guía su aprendizaje, un ejemplo típico es el de
55. un ratón que debe aprender a recorrer un laberinto en la salida del laberinto
56. la recompensa podría hacer por ejemplo un trozo de queso la posición inicial
57. dentro del laberinto sería el estado inicial y la salida el estado final
58. dentro del laberinto también tiene que haber situaciones fácilmente
59. identificables que corresponden a situaciones en las que se deben tomar
60. decisiones que en este caso son acciones para realizar un avance en el laberinto
61. por ejemplo las esquinas los cruces de los pasillos y los extremos de pasillos
62. sin salidas serían estados de este problema en cada estado hay
63. o más acciones posibles si el agente llega a un cruce hay cuatro acciones
64. posibles pero en el extremo de un pasillo solamente cabe una sola acción
65. que es ir hacia atrás. El agente no conoce el mapa del laberinto así que
66. debe aprender dicho camino por eso debe recorrer el laberinto en forma aleatoria
67. y aprender mediante la prueba y error. El aprendizaje por refuerzo consiste
68. precisamente en aprender aquellas acciones que conduzcan al camino más
69. corto para atravesar el laberinto

Aprendizaje profundo

1. El aprendizaje profundo también conocido como deep learning, en inglés. Es una


2. familia de métodos que aprenden representaciones de datos con múltiples
3. niveles de abstracción, es parte del aprendizaje automático también es
4. conocido como redes neuronales profundas porque tratan de emular el enfoque de
5. aprendizaje que los seres humanos utilizan para obtener ciertos tipos de
6. conocimiento en su forma más simple, el aprendizaje profundo puede considerarse
7. como una forma de automatizar el análisis predictivo estos algoritmos
8. aplican en cascada un conjunto de transformaciones no lineales de forma
9. que cada nivel recibe como entrada la salida del nivel anterior, aprendiendo
10. así representaciones cada vez más complejas por ejemplo, para aprender a
11. reconocer sillas basándose en imágenes de muchas sillas como datos de
12. entrenamiento el primer nivel de un sistema de aprendizaje profundo recibirá
13. como entrada una matriz de contenidos de valores de
14. píxeles de una imagen y lo que aprendes son características de bajo nivel como
15. por ejemplo líneas, rectas en distintas orientaciones estas líneas constituyen
16. los datos de entrada del segundo nivel que a su vez aprende una representación
17. de características un poco más abstracta como por ejemplo una serie de líneas
18. formando contornos que delimitan regiones de la imagen a su vez estos
19. contornos alimentan al tercer nivel que aprende otra representación de
20. características todavía más abstracta como por ejemplo, partes de una silla, así
21. hasta el último nivel en el que el sistema reconocerá la silla completa en
22. otro ejemplo, imagina a un niño que está aprendiendo la palabra perro o el
23. concepto perro, el niño aprende lo que es y lo que no es un perro señalando
24. objetos y diciendo la palabra perro el niño señala y el padre evalúa si es
25. un perro, no es un perro mientras el niño continúa apuntando a los objetos se
26. vuelve más consciente de las características que poseen todos los
27. perros, lo que el niño hace sin saberlo es aclarar una abstracción compleja en
28. este concepto el concepto de perro construyendo una jerarquía en la que
29. cada nivel de abstracción se crea con el conocimiento que se obtuvo de la capa
30. precedente el aspecto clave del aprendizaje profundo es que estas
31. características cada vez más abstractas no están diseñadas manualmente por el
32. programador del sistema sino que son automáticamente extraídas mediante el
33. aprendizaje es decir, los programas informáticos que utilizan el aprendizaje
34. profundo en cada algoritmo en la jerarquía aplica una transformación en
35. su entrada y utiliza lo que aprende para crear un modelo estadístico como salida
36. las iteraciones continúan hasta que la salida ha alcanzado un
37. nivel de precisión aceptable el número de capas de procesamiento a través de
38. los cuales los datos deben pasar es lo que inspiró la etiqueta de profundidad
39. "deep" uno de los métodos de aprendizaje profundo más conocidos son las redes
40. neuronales profundas, en este caso el algoritmo básico de aprendizaje que se
41. usa en cada uno de los niveles es el mismo que en las redes neuronales
42. clásicas que contienen únicamente dos niveles. Este algoritmo propuesto por
43. Hinton y Williams en 1986 se llama Backpropagation y consiste en llevar a cabo un
44. descenso por gradiente esto es por variaciones actualizando los pesos de
45. las conexiones entre neuronas de forma que se minimice el error de
46. clasificación de acuerdo a los datos de entrenamiento. Aunque las redes
47. neuronales son múltiples no es un concepto nuevo hasta ahora no se había
48. podido usar debido a que requiere una enorme cantidad de datos de
49. entrenamiento para que sean capaces de aprender además del uso del software y
50. hardware sofisticado gracias a la disponibilidad de cientos de miles
51. incluso millones de datos de entrenamiento como por ejemplo las
52. imágenes en internet de toda clase de objetos animales etcétera y gracias al
53. acceso a computadoras de altas prestaciones ha sido aplicar el método
54. del aprendizaje profundo con éxito para reconocer patrones. Actualmente se están
55. desarrollando muchas aplicaciones del aprendizaje profundo, entre ellas el
56. diagnóstico médico basado en imágenes y el reconocimiento visual de objetos en
57. robótica los algoritmos de aprendizaje profundo al ser parte del aprendizaje
58. automático incluyen aplicaciones de modelización de datos y reconocimiento
59. de patrones además también pueden utilizar aprendizaje supervisado o no
60. supervisado en este caso es mejor el no supervisado
61. como vemos en este ejemplo, en un algoritmo supervisado construido para
62. aprender el concepto de perro inicialmente el algoritmo sería provisto
63. de datos de entrenamiento que son un conjunto de imágenes para las cuales un
64. ser humano ha etiquetado cada imagen como perro o como no perro. El algoritmo
65. utiliza la información que recibe de los datos de entrenamiento para crear un
66. conjunto de características para el perro y así construir un modelo
67. predictivo en este caso el modelo que la computadora crea por primera vez podría
68. predecir que cualquier cosa en una imagen que contenga cuatro patas y una
69. cola, debería estar etiquetada como, perro.

Robotica

En la presente unidad, se muestra una introducción a la robótica. Se describen sus

conceptos y se muestran sus ramificaciones o áreas, así como también, se

muestran los robots más destacados. Además, se describe la problemática del

empleo en relación a los robots.

Conceptos
La robótica es la ciencia que estudia los fundamentos de las máquinas capaces

de imitar tareas humanas, hasta llegar a recrear inteligencia. Es una rama de la

inteligencia artificial. Un robot es un dispositivo manipulador controlado por

computadora.

La robótica es la ciencia que estudia los robots, y estos son cualquier agente

autónomo que reside en la propia máquina y además son inteligentes ya que tienen

la capacidad de tomar decisiones con base en la información de sus sensores.

1. Estamos en los inicios de la cuarta revolución industrial. El mundo interconectado que


nos
2. proporcionan internet, la inteligencia artificial y la robótica, ya están modificando nuestra
3. rutina y lo hará aún más en un futuro próximo.
4. La investigación en estos campos avanza a gran velocidad, deslumbrándonos con
descubrimientos
5. que, hasta ahora, formaban parte de la ciencia ficción.
6. Sin embargo, la sociedad, que es el campo real de experimentación de esta revolución,
7. y que finalmente tendrá que vivir con los robots y la inteligencia artificial, ¿está
8. preparada para un cambio tan drástico?
9. Mucha de esta tecnología del futuro ya existe; sin embargo, son muchos los que
aseguran que
10. su implantación masiva tardará. Incluso puede que más de lo que tardaron en aceptarse
11. los inventos durante la Revolución Industrial. Por el contrario, otros la ven inminente.
12. Es un trabajo de mentalización y de educación.
13. Los científicos nos presentan unas máquinas que se parecen a nosotros físicamente y
que
14. son capaces de mejorar nuestra eficiencia. Pueden analizar con más lógica y rapidez
15. que nosotros, trabajar más horas incluso sin dormir.
16. Áreas de la robótica.
17. Robótica Industrial. La robótica industrial es uno de los campos
18. de más auge de la robótica. El robot industrial suele ser el típico brazo que suelda
19. mientras ensambla partes de un producto en la cadena de montaje de una fábrica. La
industria que
20. más utiliza robots de este tipo es la automovilística. Un robot industrial es cualquier
máquina
21. que posea brazos articulados móviles que permita cierta manipulación. Los más
comunes
22. son los brazos robot.
23. Robótica de servicio. Según la Federación Internacional de Robótica,
24. un robot de servicio opera de manera automática o semiautomática para realizar
servicios
25. útiles al bienestar de los seres humanos o a su equipamiento, excluyendo las
operaciones
26. de fabricación. Pueden utilizarse para cuestiones militares,
27. aspirar en la limpieza, para el mantenimiento de línea de alta tensión o para rescates
28. submarinos, entre otros usos. Dentro de los robots de servicio también
29. se pueden incluir a los robots domésticos, robots de ocio y robots de educación.
30. Los domésticos, como su nombre indica, son aquellos que realizan este tipo de trabajos,
31. como barrer, aspirar, limpiar, etc. Un robot doméstico tiene que reunir una serie
32. de características: Debe realizar los trabajos sin intervención humana. Debe realizar sus
33. trabajos con total autonomía.
34. Por eso cuentan con sensores que le permiten esquivar obstáculos, reconocer la
superficie
35. que va a aspirar y encontrar la estación de recarga cuando sus baterías están a punto
36. de agotarse. Sólo requiere la intervención humana para introducir el programa deseado.
37. Robótica de ocio. Entre estos, tenemos los robots mascota, cada
38. vez más frecuentes en los hogares, desde un Furby hasta mascotas más sofisticadas
39. y robotizadas, como la mascota Pleo. Estos robots mascota intentan imitar a las
40. fases humanas de crecimiento emocional y de aprendizaje. A medida que la mascota va
creciendo,
41. gracias a los cuidados del niño o la niña, el robot se transforma hasta llegar a la etapa
42. adulta.
43. También se han puesto al servicio de niños con problemas de autismo para apoyar sus
terapias.
44. También, se están desarrollando robots humanoides para la asistencia a personas con
discapacidad,
45. ancianos o incluso para el cuidado de niños pequeños.
46. Como ves, la robótica se abre paso y a la vez se interrelaciona con otras disciplinas,
47. como la psicología, sociología, con el fin de poder crear robots asistentes que
48. aprendan a reconocer y gestionar expresiones faciales o comportamientos humanos
para interactuar
49. con las personas en la vida cotidiana.
50. Robótica de educación. Los centros educativos están empezando a
51. introducir la robótica como medio de aprendizaje, ya sea para explicar otras materias en
sus
52. clases o para introducir a los alumnos en la mecánica, robótica, mecatrónica, la
53. programación o la electrónica. También, existen robots para enseñar a los
54. niños idiomas, principalmente la pronunciación y el vocabulario.
55. Desarrollo de proyectos de Robótica
56. Arduino es una de las plataformas más utilizadas para llevar a cabo proyectos
tecnológicos
57. de robótica. Esto, debido a su versatilidad, a la cantidad de sensores que puede
incorporar,
58. a su facilidad de uso y a los precios bajos. Se emplea un lenguaje de programación
59. especial, que se basa en la sintaxis de otros lenguajes, como C y C++. Aún así, este
lenguaje
60. que utiliza Arduino, posee sus características propias, orientado a una fácil
programación
61. de los sensores y dispositivos externos.
62. El futuro del trabajo Existen estudios que han analizado la cantidad
63. de trabajos que desaparecerán con la llegada de los robots y la inteligencia artificial.
64. En su informe "El Futuro del empleo 2018", el Foro Económico Mundial pronostica que
65. se perderán empleos. En la actualidad, debido a los avances tecnológicos,
66. el 29% de las tareas laborales son realizadas por una máquina. Este porcentaje significa
67. la pérdida de 75 millones de empleos para 2025. Sin embargo, se señala que se crearán
68. nuevos roles o funciones que necesitarán de un mayor grado de especialización. Así,
69. se abrirán oportunidades que permitirán el surgimiento de más de 133 millones nuevos
70. roles de trabajo.
71.
Robots destacados

Pepper

Es un robot semi-humanoide fabricado por SoftBank Robotics. Fue presentado en


2014 y en 2015 ya se vendía en Japón.

Es el primer robot humanoide social del mundo. Puede reconocer rostros y


emociones humanas básicas.

Actualmente, el robot está presente en empresas y escuelas. Más de 2.000


compañías ya lo adoptaron como asistente para recibir, informar y guiar a los
visitantes que reciben.

Pepper se ha convertido en un recurso instrumental para las empresas en los


Estados Unidos. Ha mejorado su capacidad para aprender, evolucionar y adoptar
nuevas características. Continúa comprometiendo e informando a los clientes,
capacitando a los empleados, optimizando las operaciones y facilitando el
aprendizaje. Según palabras de sus diseñadores.

El futuro para Pepper es conectarse a las herramientas de una empresa (sistemas


de gestión de inventario, por ejemplo). Así, recibirá información y análisis en tiempo
real, que irá procesando.

Atlas

Es el robot desarrollado por la compañía de Estados Unidos Boston Dynamics, se


dio a conocer en 2013. Mide 1.50 metros y pesa 75 kilogramos, fue diseñado para
tareas de búsqueda y rescate. Puede correr a gran velocidad, saltar obstáculos y
hasta hacer parkour (es una actividad física conocida como "acrobacia urbana").

Insight

Es el robot geofísico que lanzó NASA y llegó a Marte el 26 de noviembre de 2018.


Tiene sensores que miden el suelo y la temperatura para analizar la evolución
geológica del planeta. La tecnología de InSight permite entender mejor los planetas
similares (Venus, Mercurio y etc). En resumen estudia la estructura interna del
planeta.

Sistemas Expertos
Conceptos

Un sistema experto es una máquina que piensa y razona como un experto


lo haría en una cierta especialidad o campo. Un sistema experto puede
definirse como un sistema informático de hardware y software que simula a
los expertos humanos en un área de especialización.

El sistema experto es capaz de procesar y memorizar información, aprender y


razonar en situaciones deterministas e inciertas, comunicarse con los humanos y
otros sistemas expertos, tomar decisiones apropiadas y explicar por qué se han
tomado tales decisiones.

Por ejemplo, un sistema experto en diagnóstico médico, requiere como datos los
síntomas del paciente, los resultados de análisis clínicos y otros hechos relevantes,
y, utilizando estos, busca en una base de datos la información necesaria para poder
identificar la correspondiente enfermedad.

1. icio de la transcripción. Saltar al final.


2. Las investigaciones the new world y simon sobre la forma en que un ser
3. humano resuelve problemas, dieron como resultado un modelo basado en lo que
4. llamaron sistema de producción éste consistía en representar conocimientos
5. sobre cómo resolver un problema mediante reglas de producción.
6. Estas reglas eran del tipo sí entonces donde la parte si contenía alguna premisa que
debía
7. cumplirse con el fin de poder aplicar la parte entonces qué consistía en una
8. acción. Las reglas de producción se almacenaron en lo que llamaron memoria a
9. largo plazo que procesaría datos sobre tareas concretas a resolver que estaban
10. contenidas en otra memoria a corto plazo de forma que cuando algún dato cumpliera
11. la condición expresada en la premisa de alguna regla ésta se activaría y se
12. llevaría a cabo la acción indicada en dicha regla.
13. Esta idea de representar conocimientos mediante reglas del tipo sí entonces dio
14. lugar a los sistemas expertos una de las técnicas más importantes que
15. ha dado la inteligencia artificial. Personal con poca experiencia puede
16. resolver problemas que requieren un conocimiento de expertos. Ayudan en los
17. casos en los que hay pocos expertos humanos. El número de personas con acceso
18. al conocimiento aumenta con el uso de sistemas expertos. El conocimiento de
19. varios expertos humanos puede combinarse, lo que da lugar a sistemas expertos más
20. fiables, ya que se obtiene un sistema experto que combina la sabiduría
21. colectiva de varios expertos humanos en un lugar. Los sistemas expertos pueden
22. responder a preguntas y resolver problemas mucho más rápido que un
23. experto humano, además, ayudan en los casos en que la complejidad del problema
24. impide al experto humano resolverlo. Los sistemas expertos pueden ser utilizados
25. para realizar operaciones monótonas aburridas e in confortables para los
26. humanos. El primer sistema experto propiamente
27. dicho fue heurística desarrollado durante 10
28. años desde principios de los años 70 en la nueva universidad de stanford en el
29. ámbito de la química orgánica, era capaz de hipotetizar la estructura topológica
30. de un compuesto químico es decir la disposición espacial de sus átomos para
31. interpretar su espectrograma de masas usando conocimientos de químicos
32. expertos en analizar la información proporcionada por el espectrómetro estos
33. conocimientos se representaron mediante reglas si entonces, otro ejemplo fue un
34. proyecto que se desarrolló en la universidad de stanford en el que los
35. investigadores your life buchanan y cohen desarrollaron el famoso sistema
36. experto llamado MYCIN también utilizaba reglas del tipo sí entonces
37. para representar el conocimiento de médicos expertos en enfermedades
38. infecciosas la parte si de una regla típica de MYCIN describía posibles
39. síntomas y la parte entonces expresaba una posible causa de
40. dichos síntomas; a mediados de los años 80s había centenares de sistemas
41. expertos desarrollados en todo el mundo en distintos dominios de aplicación los
42. espectaculares éxitos alcanzados con los sistemas expertos cambiaron
43. significativamente las prioridades de investigación en la inteligencia
44. artificial ya que en lugar de focalizar esfuerzos en desarrollar sistemas
45. generales de resolución de problemas la mayoría de los investigadores se
46. dedicaron a resolver problemáticas muy específicas. Hoy día entre muchos
47. ejemplos cotidianos tenemos a los cajeros automáticos y los semáforos como
48. sistemas expertos algunas áreas en las que más se utilizan son las siguientes:
49. negocios, industria, medicina, ingeniería y ciencias aplicadas. Existen algunos
50. problemas en su implementación como el costo de los procesos de adquisición de
51. conocimientos, el desarrollo decisión de un sistema experto es
52. generalmente caro, pero el mantenimiento y el costo marginal de su uso repetido
53. es relativamente bajo, la ganancia en términos monetarios tiempo y precisión
54. resultantes del uso de los sistemas expertos son muy altas y la amortización
55. es muy rápida sin embargo antes de desarrollar o adquirir un sistema
56. experto debe realizarse un análisis de factibilidad y de costo-beneficio otro
57. problema es su fragilidad ya que únicamente pueden resolver situaciones
58. específicas que estén representadas con reglas sí entonces, por ejemplo, si un
59. sistema experto en medicina no contiene el conocimiento de que únicamente las
60. mujeres pueden tener embarazos dicho sistema podría preguntar por los
61. resultados de una prueba prenatal para pacientes varones, esta fragilidad está
62. relacionada con la ausencia de conocimientos de sentido común en los
63. sistemas expertos.
64.
Componentes de un sistema experto

1. Expertos humanos. Se requiere la colaboración de uno o varios expertos


humanos especialistas en el tema de estudio y los ingenieros del
conocimiento.
2. Base de Conocimiento. Los especialistas son responsables de suministrar a
los ingenieros del conocimiento una base de conocimiento ordenada y
estructurada, y un conjunto de relaciones bien definidas y explicadas.
3. Subsistema de Adquisición de Conocimiento. Controla el flujo del nuevo
conocimiento que fluye del experto humano a la base de datos.
4. Control de la Coherencia. Controla la consistencia de la base de datos y
evita que unidades de conocimiento inconsistentes entren en la misma.
5. El Motor de Inferencia. Es el corazón de todo sistema experto. Obtiene las
conclusiones aplicando el conocimiento a los datos.
6. Subsistema de adquisición de conocimiento. Se utiliza para obtener el
conocimiento necesario y continuar con el proceso de inferencia hasta que se
hayan sacado conclusiones.
7. Interfase de Usuario. Es el enlace entre el sistema experto y el usuario.
8. Subsistema de ejecución de órdenes. Es el componente que permite al
sistema experto iniciar acciones.
9. Subsistema de Explicación. Da explicaciones de las conclusiones
obtenidas o de las acciones iniciadas por el sistema experto.
10. Subsistema de Aprendizaje. Lleva a cabo el aprendizaje estructural
al aprender reglas, distribuciones de probabilidad, etc. y también el
aprendizaje paramétrico al estimar los parámetros necesarios para construir
la base de conocimiento. Obtiene experiencia a partir de los datos
disponibles.

Resumen

● Alan Turing registró las primeras bases de la inteligencia artificial, en particular


estudió en forma científica a las máquinas inteligentes. Trabajó en la teoría de
compatibilidad y creó uno de las primeras computadoras electromecánicas.
● En el futuro se vislumbra que se continuará con las investigaciones para el
desarrollo de una inteligencia artificial general, más que especializada, es decir, una
inteligencia más apegada al ser humano, lo cual es muy difícil de lograr.
● Algunos términos relacionados con la inteligencia artificial son los siguientes:
algoritmo, aprendizaje automático, autonomía, inteligencia artificial débil y fuerte.
● Las principales aplicaciones de la inteligencia artificial se han realizado en las áreas
siguientes: logística, transporte, agricultura, salud, biotecnología, ventas al detalle,
educación, entretenimiento, industria aeroespacial, servicios financieros,
manufactura, cadena de suministro, socio-economía y mercadotecnia.
● Algunos modelos o ramas de la inteligencia artificial son los siguientes: aprendizaje
automático, robótica, sistemas expertos.

Ahora que has leído sobre el tema de inteligencia artificial, reflexiona la respuesta
de la siguiente pregunta: ¿Bajo qué condiciones sería posible construir una máquina o
robot con inteligencia artificial general, que sea tan inteligente como el ser humano?

Publica en el foro una historia en la que describas tu vida dentro de 30 años, en un


día cotidiano. Debes resaltar los aspectos tecnológicos relacionados con la
inteligencia artificial.

La extensión deberá ser de 3 a 6 párrafos.

introducción a la sección que trata sobre el procesamiento del lenguaje natural,


conocido como PLN.

1. Esta sección trata sobre el procesamiento del lenguaje natural, también conocido como
2. PLN. Que se enfoca en analizar las interacciones entre las computadoras y el lenguaje
humano.
3. En estos contenidos se muestra una introducción al procesamiento del lenguaje natural.
Se
4. describen los conceptos relacionados con el PLN, los tipos y modelos de
procesamientos
5. y las problemáticas relacionados con el análisis del lenguaje en sus formas hablada y
escrita.
6. También se examinan las diferentes técnicas de análisis, en particular el aprendizaje
7. automático. Se muestran las diversas aplicaciones, mostrando un esquema de cómo se
realiza un
8. análisis de sentimiento en twitter y se realizan ejercicios prácticos mediante
herramientas
9. en internet.
10. Además se realiza una práctica paso a paso con el software RapidMiner de análisis de
11. sentimiento en twitter. El procesamiento del lenguaje natural hablado
12. o escrito, es una importante área de desarrollo de la inteligencia artificial. Es esencial
13. comprender que todavía no se logra una exactitud total en la traducción y comprensión
de
14. textos y audios, debido a los problemas de ambigüedad y estructura del lenguaje.
15.

1. Vamos a comenzar a revisar el procesamiento del lenguaje natural.


2. El procesamiento del lenguaje natural (PLN), consiste en las técnicas de representación
3. del lenguaje humano. El PLN Estudia las interacciones entre las computadoras y el
lenguaje humano.
4. Es una disciplina que se ocupa de la formulación e investigación de mecanismos
computacionales
5. para la comunicación entre personas y máquinas mediante el uso de Lenguajes
Naturales.
6. Un Lenguaje Natural es el que se utiliza en la comunicación humana, ya sean escritos,
7. hablados o mediante signos. Esta habilidad de la máquina para procesar
8. la información comunicada, no simplemente se refiere a las letras o los sonidos del
9. lenguaje, sino, todo el mensaje como tal. Es decir, una contestadora telefónica, una
10. impresora o un procesador de textos, no son dispositivos de inteligencia artificial que
11. utilicen algoritmos de procesamiento del lenguaje natural. Un programa de traducción
automática
12. de textos o audios, sí lo es.
13. El PLN es un campo de las ciencias de la computación, inteligencia artificial y lingüística.
La
14. ciencia que estudia el PLN es la lingüística computacional, que en su etapa actual de
desarrollo,
15. es principalmente una rama de las tecnologías de aprendizaje automático que son parte
de
16. la inteligencia artificial.
17. El procesamiento de lenguaje natural, puede ser de tipo simbólico, que se caracteriza
18. por sistemas que almacenan la fonología/fonética, morfología, sintaxis, semántica,
pragmática
19. y discurso, a través de representaciones.
20. O bien, el PLN puede ser de tipo estadístico, que se caracteriza por la aplicación de
técnicas
21. matemáticas para inferir conocimiento. Estos procesamientos de lenguajes son
fundamentales
22. para la traducción de textos, donde actualmente la tasa de error alcanza el 20-30%. Esto
se
23. produce por los problemas de ambigüedad que sólo tienen solución con el conocimiento
24. del entorno donde se utiliza el lenguaje. Es decir, el procesamiento del lenguaje natural
25. es complicado y no se tiene aún la confiabilidad al 100%, aunque se ha investigado
mucho sobre
26. este tema. El conocer el contexto en donde se emitió un mensaje de texto que se quiere
27. analizar, ayuda mucho en la exactitud del análisis.
28. ¿Cuántas veces hemos malinterpretado un mensaje de WhatsApp? Nos imaginamos
que se
29. quiso decir algo, pero en realidad era otra cosa la que se pretende expresar, o el
mensaje
30. no tenía la intención que nosotros asumimos que tenía.
31. Más aún, cuántas veces no comprendemos al cien por ciento una frase que nos dice
32. una persona cara a cara, no sabemos si es sarcasmo, si está vacilando o si está
hablando
33. en serio.
34. Ahora, imagina la dificultad que esto representa para los programadores de algoritmos
de análisis
35. de procesamiento de texto o del habla.
36. Además, el procesamiento del lenguaje natural hablado también es fundamental para la
inteligencia
37. artificial. Esto representa diversos problemas como los siguientes:
38. El primero es el procesamiento de habla. Para lograr una comunicación hombre - robot
eficiente,
39. las máquinas deben entender el lenguaje hablado.
40. El diálogo. No debe ser un monólogo. El problema es que en los diálogos se usan
mucho
41. las oraciones incompletas o recortadas a una sola palabra, lo cual dificulta su análisis.
42. Generación del lenguaje. El robot debe componer, estructurar y ordenar las oraciones.
43. Finalmente, se tiene el problema de relacionar las palabras con las acciones, objetos y
circunstancias
44. en la conversación. Si le decimos al robot, “barre”, él debe tomar una escoba y barrer.
45. Lo cual implica comprensión y movimientos .
46. El procesamiento del lenguaje natural hablado o escrito, representa una enorme área de
47. la inteligencia artificial. Se han realizado muchas investigaciones y se tiene un gran
48. avance al respecto, sin embargo, en ambos casos, todavía no se logra una exactitud
49. total, debido a los problemas de ambigüedad y estructura del lenguaje.

En los videos que verás a continuación, se revisan los niveles, técnicas y modelos
del análisis del lenguaje.
Niveles: morfológico, sintáctico, semántico y pragmático.
Técnicas: lingüísticas formales y probabilísticas.
Modelos: lógicos y probabilísticos.

Técnicas de procesamiento de lenguaje natural parte 1


1. Bien en este vídeo vamos a revisar las técnicas del procesamiento del lenguaje
2. natural primero qué es lo que yo tengo que hacer
3. para realizar un análisis del lenguaje o bien qué significa analizar el lenguaje
4. pensemos en un lenguaje ahorita un ejemplo muy sencillo que es una mínima
5. parte de un lenguaje que es este texto que yo tengo aquí el niño corre vamos a
6. suponer que ese es ahorita nuestro lenguaje que en realidad es un texto que
7. yo quiero analizar bien la estructura del lenguaje se analiza en cuatro
8. niveles o sea este texto que yo tengo aquí lo voy a analizar en cuatro niveles
9. diferentes esto es en cuatro etapas diferentes entonces el análisis de un
10. lenguaje se lleva a cabo mediante etapas y son básicamente cuatro etapas
11. principales las que yo voy a realizar entonces yo tengo este mensaje o esta
12. frase el niño corre lo primero que yo voy a hacer en mi primera etapa voy a
13. realizar un análisis morfológico en qué consiste este análisis morfológico dice
14. es el análisis de las palabras para extraer las raíces o unidades léxicas es
15. decir se va a hacer un análisis de las palabras que contiene este mensaje
16. y se va a identificar las unidades léxicas que son las unidades léxicas es
17. la expresión mínima de un lenguaje entonces la expresión mínima del
18. lenguaje que son pues identificadores o sea las palabras las letras que te
19. forman que forman palabras estas palabras es una expresión mínima que en
20. un lenguaje se puede llamar un identificador se puede llamar por
21. ejemplo aquí le estamos poniendo artículo sustantivo verbo son
22. identificadores que se van dando como resultado todo el análisis que tú hagas
23. de esta frase entonces este análisis morfológico que es lo que hace pues
24. recorrer cada uno de las letras o de los elementos o caracteres que tú tienes en
25. el mensaje y entonces llega y dice esta es una letra la letra e y la guarda en
26. la memoria ésta es la letra l y la guarda en la memoria entonces en la
27. memoria ya tiene la y la l tiene el viene la siguiente y dice es un espacio
28. en blanco al momento que dice que es un espacio en blanco agarra lo que tiene en
29. la memoria que era la e y la ele y la guarda en esta tabla
30. y el que es este identificador lo va a guardar que aquí le estamos poniendo
31. artículo entonces cada que se encuentra un espacio en blanco va tomando y va
32. almacenando lo que él tiene en la memoria en la siguiente área el
33. recorrido es decir esta es una letra n la guarda la y la guarda a la niña y la
34. guarda y la o la guarda y luego se encuentra un espacio en blanco al
35. encontrarse el espacio en blanco viene por lo que guardo que fue la palabra
36. niños a la unidad léxica niño y lo mete la tabla de otra palabra entonces vean
37. cómo va separando el niño corre ahora es una tabla de ser una frase de texto sin
38. estructura vean como ahora se convierte en una estructura que es una tabla que
39. tiene dos columnas en la primera columna va a tener la unidad léxica que extrajo
40. de ese texto y en la segunda el tipo de unidad léxica que nosotros tenemos aquí
41. entonces en ese consiste el análisis morfológico ahora bien después de que
42. tenga esta tabla va a pasar al análisis sintáctico y que se refiere dice es el
43. análisis de la estructura sintáctica de la frase mediante una
44. gramática es decir el orden de los elementos identificados entonces ya
45. tiene estos indicadores y ya dijo que tiene un artículo un sustantivo y un
46. verbo que es lo que hace el análisis sintáctico va a verificar que éstos
47. estén en orden porque aquí primero se encontró el luego el niño y luego corre
48. entonces el orden fue artículo sustantivo y verbo bien el análisis
49. sintáctico revisa que estén en orden correcto pero quién le dice el orden el
50. orden se lo dice la gramática en la gramática es donde está guardado el
51. orden una gramática es algo como esto que dice el sujeto va a ser igual al
52. artículo más un sustantivo más un verbo entonces esto podríamos nosotros
53. interpretarlo como una regla gramatical en donde para formar un artículo tiene
54. que venir primero para formar un sujeto tiene que venir primero un artículo
55. después venir un sustantivo y después venir un verbo entonces con esto se
56. refiere al orden gramatical entonces dada esta
57. tabla dice es un artículo pregunta lo que sigue es un sustantivo porque aquí
58. sigue un sustantivo si es correcto y después sigue un verbo sí sí es correcto
59. entonces si se da que está en la tabla un artículo más un sustantivo más un
60. verbo en ese orden entonces esto es un sujeto entonces el niño corre ahora es
61. un sujeto es lo que tenemos aquí entonces esto es lo que hace la etapa de
62. análisis sintáctico tenemos dos las siguientes dos etapas que es el análisis
63. semántico y el análisis pragmático que revisan el significado de todos estos
64. elementos que tenemos aquí entonces hay cuestiones muy propias del lenguaje en
65. particular que se esté realizando en donde estas dos etapas pues les dan el
66. sentido a esta frase que yo estoy analizando entonces eso es lo que hace
67. el análisis semántico y el análisis pragmático bien entonces hasta aquí
68. hemos analizado las del análisis del lenguaje y estas etapas
69. son análisis morfológico análisis sintáctico análisis semántico y análisis
70. pragmático.
71.

Técnicas de procesamiento de lenguaje natural parte 2


1. Bien ahora lo que vamos a realizar en este vídeo son las técnicas y modelos de
2. análisis del lenguaje, ¿cuáles son las técnicas que tengo para realizar un
3. análisis del lenguaje?, bueno tengo dos tipos las técnicas lingüísticas formales
4. y las técnicas probabilísticas las primeras se refieren al desarrollo de
5. reglas estructurales que se aplican en la fase de análisis del lenguaje ahorita
6. las vamos a revisar pero entonces una técnica lingüística formal se refiere a
7. que yo tengo un conjunto de reglas basadas en una estructura y sobre ese
8. conjunto de reglas yo voy a realizar este análisis del lenguaje por el
9. contrario las técnicas probabilísticas dice que se basan en el estudio de un
10. conjunto de textos de referencia a los que se les conoce como un corpus que es
11. es un conjunto en este caso un conjunto de textos de referencia que tienen
12. características de tipo probabilístico asociadas a las distintas fases del
13. análisis del lenguaje entonces aquí en estas técnicas probabilísticas yo no voy
14. a tener una de reglas de entrada o de inicio sino
15. que primero voy a tener un conjunto de textos en donde ya se están utilizando
16. todos los textos y los voy a estar analizando y probabilísticamente
17. entonces voy a identificar la forma en que se van organizando todos esos textos
18. y ahí están implícitas todas las reglas gramaticales entonces derivado de estos
19. dos tipos de técnicas tengo los modelos que son los modelos para el
20. procesamiento del lenguaje y el primer modelo son el modelo lógico que se basa
21. precisamente en las gramáticas o sea es utilizando la técnica lingüística formal
22. es decir la gramática es ese conjunto de reglas estructurales y tengo los modelos
23. probabilísticos que están basados en un conjunto de textos que son estas
24. técnicas probabilísticas que toman como base un conjunto de textos de referencia
25. es decir un corpus entonces los dos modelos que yo tengo para realizar este
26. análisis es el modelo lógico y el modelo probabilístico ahora bien vamos a
27. analizar cómo se llevaría a cabo el análisis mediante una lingüística
28. formal que recordemos que es una serie de reglas gramaticales que yo tengo aquí
29. entonces esto que tenemos aquí imaginemos que es una estructura
30. gramatical es decir es una gramática y esta gramática se entendería de la
31. siguiente forma por ejemplo yo voy a decir una oración se compone de una efe
32. nominal que es una frase nominal más una frase verbal más un complemento entonces
33. esto es una regla si yo identifico que tengo una frase nominal y en seguida una
34. frase verbal y en seguida un complemento entonces yo estoy hablando de una
35. oración ahora bien esta frase nominal de que se compone aquí está la regla es
36. decir la frase nominal se va a componer de un artículo más un sustantivo
37. entonces esta es otra regla gramatical la frase verbal que tenemos aquí de que
38. se compone de un verbo el artículo que tenemos aquí de qué se
39. compone es una cadena de caracteres el sustantivo que lo tenemos es una cadena
40. de caracteres y el verbo es una cadena de caracteres entonces esta es la
41. gramática y si la viéramos en forma de un árbol es decir la oración que tenemos
42. aquí se va a formar de una frase nominal más una frase verbal si se fijan aquí no
43. tenemos un complemento pero es válido que yo pueda tener la parte de la frase
44. nominal más la frase verbal ahora la frase nominal de que se compone dice la
45. regla de un artículo más un sustantivo entonces yo tengo aquí un artículo y un
46. sustantivo y este artículo de qué se compone el artículo se compone de una
47. cadena de caracteres aquí está el y el el sustantivo de que se compone de una
48. cadena de caracteres aquí está la en el águila en el lado la frase verbal de que
49. se compone de un verbo y el verbo de que se compone de una cadena de caracteres
50. la cela hola airlines entonces esto es cómo funcionan las gramáticas formales
51. ahora bien cómo funcionan los modelos probabilísticos estos modelos
52. probabilísticos es a la inversa o sea yo no parto de que tengo una gramática y
53. que debo analizar mi frase para ver si hay encajan aquí qué es lo que pasa dice
54. las personas o lingüistas recopilan un corpus o un conjunto de ejemplos de
55. datos es decir van a tener como muchos documentos para ver cómo es que se están
56. utilizando todos los textos qué estructura tienen todos los textos
57. entonces lo primero es tener este corpus o sea este conjunto de ejemplos ahora
58. bien después a partir de este conjunto de ejemplos se calcula la frecuencia con
59. la que las unidades lingüísticas aparecen en un contexto determinado es
60. decir ya que tengo este conjunto de documentos
61. yo veo cómo están las diferentes estructuras pero también considerando el
62. contexto dice por ejemplo frecuencia en la que aparece la palabra
63. pasaporte en la colección de ejemplos y datos es decir yo tengo un conjunto de
64. documentos y veo que en todos esos documentos la palabra pasaporte aparece
65. mil veces por ejemplo entonces estos en la siguiente etapa que se hace y ya que
66. tengo yo todas las palabras que aparecen en todos estos documentos y tengo
67. cuántas veces aparecen lo cual es el porcentaje de aparición de cada una de
68. esas palabras dice con este cálculo podemos predecir cuál será la siguiente
69. unidad en un contexto dado es decir si yo ya dije que la palabra pasaporte
70. aparece una mil veces por ejemplo y yo puedo seguir con ese ejemplo y decir la
71. frecuencia en que la palabra pasaporte aparece seguida ya sea antes o después
72. de la palabra abuelo entonces si yo en esta tabla que genere en la etapa 2 me
73. dice que pasaporte aparece junto a la palabra vuelo en el 98% de
74. ocasiones quiere decir que cuando yo esté analizando un nuevo documento
75. allí el 98 por ciento de probabilidad de que cuando aparezca la palabra pasaporte
76. va a aparecer junto a la palabra vuelo entonces así es como trabaja esta forma
77. de analizar en forma probabilística esto es el paradigma del aprendizaje
78. automático precisamente dice los algoritmos infieren las posibles
79. respuestas a partir de los datos observados anteriormente en el corpus es
80. decir en el conjunto de datos de entrada entonces esto es la forma en que se
81. analiza mediante el modelo probabilístico
82.

Técnicas de procesamiento de lenguaje natural parte 3


1. Bien en este vídeo vamos a revisar de dos ejemplos de cómo se llevará a cabo
2. la implementación de la técnica y el modelo probabilístico imaginemos que
3. queremos analizar esta parte del lenguaje que sería un texto que en este
4. caso es una pregunta que dice juan usa un gato para reparar su coche entonces
5. esto se tiene que analizar para identificar vamos a suponer qué tipo de
6. gatos el que utiliza juan para identificar si es este gato que es un
7. animal o este gato que es una herramienta cuál es el gato que se
8. refiere en esta frase pues la computadora tiene que hacer un análisis
9. porque una persona pues el sentido común le diría que el gato que está utilizando
10. es el de la herramienta pero la computadora tiene que aprender eso
11. entonces que tiene que hacer pues tiene que utilizar un modelo y una técnica de
12. análisis del lenguaje para saber cuál es el gato que está utilizando juan
13. entonces cómo lo realiza esto bueno pues tenemos textos de entrenamiento entonces
14. es probabilístico recordemos que va a necesitar muchos textos
15. donde se utilicen la palabra gato para ir viendo cual se asemeja más a este
16. tipo de frase para poder identificar cuál de los dos gatos es el que debe
17. funcionar aquí entonces tiene por ejemplo un conjunto de textos y empieza
18. a sacar texto como pedro usa un martillo para anna usa un desarmador para el
19. obrero usa una grúa es y por otro lado tiene el gato como ratón es el perro
20. come la carne el hámster come avena entonces así tiene un conjunto de este
21. es el corpus todos estos son el corpus con la palabra gato y algunas se
22. refieren al gato animal y la otra al gato herramienta dice entonces el gato
23. de juan ha de ser más parecido a un martillo a un desarmador oa una grúa que
24. a un perro o un hámster entonces tiene todo este conjunto de datos esa es la
25. primera etapa que decíamos ya que tiene todo este conjunto de datos todo el
26. corpus empieza a ver todas las frases cómo se están formando cómo se van
27. formando cada una de las frases y koné se tiene que buscar
28. texto sea cual es la que más se asemeja a este contexto de esta frase decir juan
29. usa un gato para reparar un coche entonces tienen que analizar pues cuál
30. de los dos gatos es el que más se asemeja y tiene que encontrar que el más
31. parecido es el gato que esa herramienta entonces va formando un diccionario dice
32. martillo es una herramienta desarmador es una herramienta grúa una herramienta
33. gato uno animal doméstico gato 2 es una herramienta entonces pues al parecer
34. aquí lo que más se asemeja al contexto que él tiene que es esta frase es que es
35. una herramienta entonces dice de las dos acepciones de gato la segunda es la que
36. más se parece a un martillo a un desarmador o una grúa entonces el gato
37. que corresponde a esta frase es el gato de herramienta entonces así es como
38. trabaja el aprendizaje automático y fíjense qué interesante que esta forma
39. de trabajar en este siguiente ejemplo es el que utiliza el traductor de google el
40. traductor de google según el director peter norvig comenta que ellos dice
41. el aprendizaje automático a partir de ejemplos entonces utiliza un modelo
42. probabilístico dice en el inicio del proyecto los programadores intentaron
43. enseñarle el sistema reglas gramaticales y de vocabularios dice esto es un
44. sustantivo esto es un verbo y este es el orden es decir lo primero que intentaron
45. en google fue trabajar con el modelo de reglas gramaticales o sea basado en una
46. gramática usa técnicas lingüísticas formales y se dieron cuenta que no era
47. tan sencillo trabajar con estas reglas gramaticales dice el lenguaje es tan
48. fluido y extenso que los programadores no pudieron con las millones de palabras
49. y los billones de combinaciones que se pueden dar entre ellas y sobre cómo
50. cambian con el tiempo es decir yo tengo una regla gramatical pero el lenguaje es
51. un lenguaje vivo un lenguaje activo y el lenguaje se va actualizando y hay nuevas
52. palabras entonces ya no se encaja en la misma gramática y eso hace mucho más
53. difícil o yo puedo decir el niño corre o puede
54. y corre el niño y ambas formas está correcto de decirlo entonces se dan
55. muchas probabilidades que yo puedo tener y es difícil encajar se a una sola
56. gramática entonces el proyecto del traductor de google primero trato de
57. hacerlo con reglas gramaticales dice este enfoque no era el adecuado porque
58. tenía dos problemas en resumen dice las reglas del idioma son absolutas o sea la
59. gramática es absoluta pero el lenguaje está muy lejos de ser absoluto y está
60. lleno de excepciones entonces esto es lo que les decía este hay nuevas palabras
61. el lenguaje demás es complejo lleno de excepciones también es cambiante con
62. nuevas palabras que se agregan todo el tiempo y reglas que cambian para dar
63. paso al lenguaje día a día el lenguaje es un ente vivo entonces se está
64. actualizando constantemente entonces la regla el gramatical que tenemos ya no
65. funciona dice ahora que usaron un nuevo enfoque basado en datos dice el primer
66. reto fue lograr tener suficientes ejemplos es decir ellos dejaron el
67. proyecto de la regla y emprendieron el proyecto a través de
68. los métodos probabilísticos y lo primero que buscaron es ese corpus o sea un
69. conjunto de ejemplos y como lo hicieron para tener ese conjunto de ejemplos dice
70. se programaron algoritmos para buscar en la web millones de ejemplos de
71. traducciones en el mundo real y para que analizara todos esos datos para
72. encontrar los patrones acerca del modo en que las frases completas son
73. traducidas a estas frases es decir buscaron todas las traducciones que
74. había en internet y cómo se estaban realizando dice se utilizó el
75. aprendizaje automático para buscar patrones que se repitieran por ejemplo
76. una frase tal en inglés aparece que se traduce en esta otra frase al español
77. pero sólo si está cerca de esta otra palabra entonces ellos fueron buscando
78. de acuerdo a los diferentes contextos que no hemos platicado como en gato y
79. gato este cómo es que se realiza correctamente una traducción entonces
80. así ellos pudieron elaborar este traductor de google que tiene una
81. es trabaja con base en probabilidades y que no es cien por ciento exacto pero
82. tiene es una muy buena herramienta sin embargo pues tiene un porcentaje de esa
83. actitud entonces así es como trabaja porque porque no lo pudieron implementar
84. con base en las gramáticas otro ejemplo es el problema de la segmentación de los
85. textos dice yo tengo este problema de terminar las palabras de un texto en el
86. que no hay espacios en blanco entonces imagínense esta frase que yo tengo aquí
87. está este tipo de problemas dice se aplica en la traducción del japonés y el
88. chino en dónde pueden haber varias palabras sin tener
89. espacios en blanco entonces lo que se quiere es identificar las palabras que
90. yo tengo aquí es el objetivo es obtener la frase original con un cierto grado de
91. confianza que es fácil leer frases sin espacios en blanco entonces dice este
92. proceso se puede llevar a cabo mediante un modelo en negra am 1 gran 2 gran 3
93. gran que trabaja una secuencia de palabras p subíndice
94. índice 2 p subíndice n calculando sus probabilidades de aparición en la frase
95. final dado un conjunto de palabras como corpus es decir se trabaja con un
96. diccionario de palabras yo voy analizando la frase voy analizando el
97. sef y entonces voy sacando y voy separando
98. palabras yo tengo la e y la que aparece tantas veces aquí luego leo la s y digo
99. ese aparece tantas veces aquí luego leo la f y digo que ese f aparece tantas
100. veces aquí luego leo la siguiente que es la y luego que eso aparece tantas veces
101. aquí y entonces yo voy formando palabras o estructuras por ejemplo aquí es
tiene
102. una alta probabilidad de aparición entonces yo empiezo a leer y digo en ese
103. entonces ahora consulto con toda mi lista de palabras que yo fui
104. identificando y veo que es tiene una alta aparición o sea tiene una alta
105. probabilidad entonces la saco como una palabra dada su probabilidad alta como
106. una palabra que es dentro de esta frase y entonces ya tengo la e y la s y ahora
107. que sigue sigue la f y así voy a seguir buscando y voy a buscar una palabra
108. fácil y voy a buscar la que tiene un alto porcentaje de probabilidad de
109. aparición porque en todo este corpus aparece con una alta probabilidad
110. entonces ya tengo otra palabra y así voy a ir analizando dada esta probabilidad
111. las diferentes palabras para lograr separar esta frase que no tiene espacios
112. en esta frase con espacios bien pues estos son algunos ejemplos de cómo
puedo
113. yo implementar estos modelos probabilísticos
114.

A continuación, se revisa la técnica de máquina de vectores de soporte, así como


algunos problemas asociados con la misma.

El aprendizaje automático en el procesamiento del lenguaje natural -


Parte 1

1. En este vídeo vamos a revisar cómo el aprendizaje automático se utiliza en el


2. procesamiento del lenguaje natural bien dando un recordatorio acerca del
3. aprendizaje automático bueno el aprendizaje automático es importante
4. señalar que la máquina se programa para que extraiga patrones de comportamiento
5. es decir tú le das un conjunto de elementos y va a extraer los patrones
6. nos va a decir cómo tienden a comportarse eso a partir de las entradas
7. recibidas es decir de todos los datos que se le da y con base a esta
8. información con los patrones que se van identificando realizar la evaluación de
9. las nuevas entradas entonces también tenemos que recordar que hay dos tipos
10. de aprendizaje el aprendizaje supervisado y el no supervisado en el
11. aprendizaje no supervisado se realiza el procesamiento con base únicamente en las
12. entradas y en el aprendizaje supervisado se cuenta con un corpus o un conjunto de
13. elementos de entrada que ya están clasificados con sus fases de
14. entrenamiento y de prueba bien esto está relacionado con todos
15. qué es el aprendizaje automático y ya hemos platicado que el aprendizaje
16. supervisado va a recibir un conjunto de elementos para estar entrenando
17. entrenando genera el modelo y lo prueba entonces así es cómo funciona el
18. aprendizaje automático aquí tenemos precisamente un esquema de
19. este aprendizaje automático aquí tenemos las dos etapas el training o el
20. entrenamiento eso es todo esta parte de arriba y el insisto bay que aquí se le
21. llama predicción pero viene siendo la prueba del modelo la aplicación del
22. modelo para probarlo entonces yo tengo entradas tengo varios
23. elementos en la etapa de entrenamiento voy a estar dándole entradas entradas
24. entradas entonces introduzco un elemento que va a extraer una característica la
25. va a dar de alta en todas las características de este nuevo elemento
26. porque hay otros elementos que ya pasaron por aquí y que tienen diferentes
27. características y todas estas características van a ir alimentando mi
28. modelo de máquina de aprendizaje entonces todo este algoritmo va a estar
29. trabajando y se le llamamos que estos datos ya están
30. es decir todas estas entradas ya son parte del modelo porque se ha entrenado
31. con el entonces se van interpretando viene otro elemento que es también de
32. entrenamiento se extraen las características de este nuevo elemento
33. se agregan o se confirman algunas carácter las características que ya
34. había entran al modelo al algoritmo aquí está trabajando y trabajando y
35. trabajando todo esto va a ser entrenamiento que es estar revisando
36. todos los elementos de entrada para ver qué características tienen y eso lo hace
37. el algoritmo entonces este algoritmo que está trabajando aquí va a ir formando el
38. modelo de clasificador es decir yo voy a suponer que tengo un
39. árbol de decisión un árbol de clasificación aquí voy a estar
40. entrenando con una serie del corpus que son los datos de entrada que va a estar
41. extrayendo características el algoritmo está trabajando está etiquetando es
42. decir está trabajando con todas estas entradas va a generar el modelo entonces
43. aquí ya se generó el modelo este modelo se género
44. base en todas estas entradas con todos los documentos que fueron parte del
45. corpus es decir con todo el entrenamiento que se le dio se genera
46. este modelo y ahora sí ya que tengo yo este modelo lo voy a aplicar con un dato
47. nuevo es decir un dato que no fue parte de la etapa de entrenamiento es decir no
48. está etiquetado entonces en la predicción yo voy a tener una nueva
49. entrada voy a extraer una característica tengo otras características que ya están
50. asociadas y las voy a meter al modelo entonces el modelo lo va a caracterizar
51. o le va a decir de qué tipo es por qué por qué ya conoce muchos otros ejemplos
52. que vio acá en la etapa de entrenamiento y finalmente lo vuelve a clasificar lo
53. vuelvo a etiquetar para que sea que un elemento de entrada más a este nuevo
54. algoritmo entonces así es como trabajan en términos generales estos algoritmos
55. por ejemplo el problema de detección de dice las principales técnicas que se
56. utilizan son las máquinas de vectores de soporte el algoritmo neiva es un
57. clasificador de máxima entropía dice de esta manera se utilizan las categorías
58. gramatical de palabras la presencia y frecuencia de algunos términos y su
59. composición semántica dice la mayoría de estos métodos van acompañados de algún
60. diccionario que va a entregar información a priori de los términos
61. para obtener las polaridades respectivas es decir todos estos métodos que yo
62. tengo aquí que son de aprendizaje de máquina se pueden acompañar o
63. normalmente se acompañan de un diccionario para que hagan su función
64. completa entonces por ejemplo las máquinas de vectores de soporte como un
65. primer ejemplo de máquina de aprendizaje tiene aplicaciones en el procesamiento
66. del lenguaje natural el habla el reconocimiento de imágenes y la visión
67. artificial y si además son usadas en la clasificación y detección de
68. sentimientos los cuales toman los datos y los ponen dentro de un espacio de
69. características apropiado y si se basa principalmente en
70. donde usando un aprendizaje computacional logra tomar decisiones
71. aquí esto es de lo que estamos hablando entonces yo tengo de este plano que
72. hablaba en este espacio aquí tengo vectores que son estas líneas que yo
73. tengo aquí por eso se le llama máquinas de vectores de soporte entonces
74. yo tengo estos puntos y estos triángulos aquí imaginémonos que esto es un
75. conjunto de documentos con unas ciertas características y que yo los he
76. graficado en el espacio y tengo todos estos aquí y acá tengo otro conjunto de
77. características que me salieron de los documentos entonces tengo agrupados
78. estos puntos porque es una clase de características que yo tengo aquí y
79. tengo agrupados estos otros puntos porque es otra clase de características
80. entonces yo hago un vector que me va a representar todos estos puntos y hago
81. otro vector que me va a representar todos estos puntos y este vector
82. representa esta clase y este vector representa a esta otra clase entonces
83. entre las dos clases una distancia y yo voy a generar un
84. vector en este plano que es el que yo tengo aquí que me dé el margen máximo o
85. sea la distancia mayor entre cada uno de ellos que es lo que yo tengo aquí y con
86. este vector ahora en este plano que se está formando aquí con este clase y con
87. esta clase la clase de triángulos y la clase de círculos negros yo voy a tener
88. un nuevo dato o sea un nuevo documento con una nueva característica y el
89. algoritmo lo que va a decir es que si está en esta clase o sea si es de este
90. tipo de un tipo de esto o bien si es del tipo este otro que es la clase de los
91. triángulos que vemos aquí entonces a eso se refiere esta explicación de máquinas
92. de vectores de soporte que tenemos aquí entonces así es cómo funcionan estas
93. máquinas y bien tenemos algunos ejemplos de aplicación que vamos a revisar.
94.

El aprendizaje automático en el procesamiento del lenguaje natural -


Parte 2

1. Bien algunos ejemplos de estas aplicaciones por ejemplo el problema de


2. clasificar documentos se tiene este planteamiento dado un documento "D" y un
3. conjunto de categorías documentales o temas encontrar la clase a la que
4. pertenece d es decir dado un nuevo documento yo voy a revisar entre otros
5. grupos de documentos que yo ya revise y que tienen ciertas características y yo
6. quiero saber si ese nuevo documento es del mismo tipo de esos que ya revise
7. antes entonces esto se aplica para filtros anti-spam y control de
8. contenidos infantiles pero si yo tengo un nuevo programa un nuevo contenido un
9. nuevo texto y yo ya analice miles y cientos de programas que tienen
10. contenidos infantiles y ya sé qué características tienen entonces cuando
11. llega a un nuevo documento yo lo reviso a ver si ese nuevo programa
12. o nuevo contenido tiene las mismas características de los contenidos
13. infantiles y si si tiene las mismas características entonces digo que si es
14. de esa clase que este tipo de contenido infantil
15. entonces aquí lo tenemos es que matizado o sea yo tengo textos clasificados es
16. decir yo voy a analizar miles de textos de contenido infantil por ejemplo y voy
17. a sacar todas las categorías que yo identifique en todos esos tipos de
18. documentos entonces cuando quiero probar uno nuevo llega a ese nuevo documento y
19. digo que si tiene estas categorías que ya están definidas por los textos
20. clasificados y si si tienen estas categorías entonces digo que si es un
21. texto con contenido infantil entonces así es como funciona este tipo de
22. problemas otro es dice para clasificar un documento dado buscar cada documentos
23. del conjunto de entrenamiento es decir este es el problema de la clasificación
24. de documentos entonces en este problema de clasificación de documentos que es lo
25. que yo voy a realizar bueno pues yo voy a buscar entre todos estos documentos
26. que yo ya analice yo tengo este corpus que ya estuvieron analizados y que tiene
27. en diferentes categorías entonces este nuevo documento que yo voy a clasificar
28. voy a buscar en qué categoría califica en la categoría a en la categoría de
29. enlace o en la de entonces que cómo le hago pues voy a extraer las principales
30. características de este documento y lo voy a encajar en la categoría que yo
31. estoy viendo que es muy similar a la categoría que tiene el propio documento
32. y así voy a ir formando diferentes categorías de la revisión de los
33. diferentes documentos entonces es el vocabulario debe ser un conjunto de
34. términos cuya presencia o ausencia sea relevante para caracterizar la
35. pertenencia a una clase entonces todo esto yo te puedo obtener acuérdense que
36. se pueden acompañar de una tabla un diccionario donde voy a tener un
37. vocabulario y yo voy a decir por ejemplo si estoy revisando correos 'spam' voy a
38. revisar como qué tipo de vocabulario es el que tienen los correos spam y con eso
39. voy a poder identificar los demás documentos
40. aquí tenemos precisamente el problema de detección del spam y se decidir si un
41. correo electrónico es spam o no basándonos en un conjunto previo de
42. correos clasificados como spam entonces dice el corpus está formado por los
43. correos electrónicos previamente clasificados aquí está lo que decíamos
44. yo tengo varios correos electrónicos que ya analicé que son spam y que voy a
45. sacar este vocabulario que voy a tener ahí que normalmente tienen este tipo de
46. correos spam y voy a tener este diccionario y además conforme los voy
47. analizando en el entrenamiento yo voy generando más palabras entonces
48. yo voy a generar toda una serie de palabras que son clásicas de los correos
49. que están clasificados como spam de tal manera que me llega un nuevo correo
50. electrónico y yo voy a verificar si están varias o algunas de las palabras
51. que yo ya tengo aquí identificadas o frases y voy a decir que es altamente
52. probable de que este nuevo correo sea en caso de que encuentre todas estas
53. entonces así es como trabaja esta detección del spam con estas técnicas
54. bien pues hasta aquí los ejemplos es sobre esta manera de trabajar del
55. aprendizaje supervisado
1. Twitter es una de las plataformas sociales más importantes en el mundo, en la cual sus
2. más de 326 millones de usuarios pueden escribir sobre cualquier tema en sólo 280
caracteres
3. de extensión del mensaje. Los usuarios describen en forma simple, sus vidas, opiniones
o discusiones.
4. Las empresas lanzan campañas publicitarias, describen sus productos y anuncian sus
eventos.
5. Para identificar las opiniones en Twitter, es necesario realizar un análisis de
sentimientos,
6. técnica que utiliza procesamiento de lenguaje natural, análisis de texto y herramientas
computacionales
7. para clasificar comentarios subjetivos de diferentes usuarios, ya sean sentimientos
8. propiamente u opiniones sobre diversos temas.
9. Los métodos usados para este tipo de análisis tienen cerca de 15 años de aplicación, los
10. cuales se han usado para clasificar correos, reseñas de clientes o publicaciones
digitales, entre muchos otros
11. Algunas cuestiones que debes considerar para realizar un análisis de sentimiento en
twitter,
12. son determinar si existe opinión en el tweet o no y reconocer las abreviaciones y
modismos
13. típicos como las tildes El análisis consiste en determinar la polaridad
14. de una oración pudiendo tener palabras positivas y negativas en la misma frase (Ej. “Me
alegro
15. que se haya terminado, pésimo el espectáculo”, “La película no fue nada buena”).
16. Polaridad: indica si el mensaje tiene un sentimiento positivo, negativo o neutro.
17. Intensidad:
18. proporciona un valor numérico en relación con la intensidad del sentimiento.
19. Emoción:
20. clasifica el texto según los distintos tipos de emociones, como puede ser la alegría,
21. la tristeza o la ira.
22. El algoritmo para realizar el análisis de sentimiento, debe contar con la fase de
aprendizaje,
23. que consiste en tener un corpus o conjunto de mensajes clasificados para generar el
modelo.
24. Por esto, se divide este corpus en dos conjuntos: uno más grande corresponde al
conjunto de
25. entrenamiento y el otro se llama conjunto de prueba. El primero se dedica propiamente
26. al aprendizaje del algoritmo, mientras que el segundo sirve para calcular la precisión
27. del algoritmo ya entrenado.
28. Algunas acciones son necesarias en la etapa de preprocesamiento de los textos:
Eliminar
29. las URL del mensaje, tokenizar o extraer las palabras del tweet, pasar a minúsculas y
30. quitar las palabras vacías, que no aportan información de sentimiento como los artículos
31. y las preposiciones.
32. Las abreviaciones, las negaciones (como “No tengo frío”) y los emoticones que tienen
33. los textos de los mensajes, se les debe dar un tratamiento especial.
34. También reciben un análisis específico los intensificadores y reductores. Estos términos
35. son los que hacen reducir o aumentar el sentimiento total del mensaje a analizar. Estos,
no siempre
36. son fáciles de identificar y pueden variar dependiendo del contexto.
37. Por ejemplo, palabras como “muy”, “más”, “bastante” intensifican el mensaje. Y
38. “poco”, “menos”, “casi”, lo reducen. Asimismo, las palabras en mayúsculas y signos
39. de exclamación también enfatizan los mensajes. Como ves, se tiene que considerar
muchos detalles.
40. Recuerda las dificultades al procesar el lenguaje, en este caso, existe la dificultad del
análisis,
41. ya que identificar la polaridad o la emoción no siempre resulta exacto al 100%.

Análisis de sentimiento en Twitter


se explican los conceptos de Polaridad, Intensidad y Emoción, que son parte del
análisis de sentimiento en Twitter.

42. Hablando específicamente del análisis del sentimiento en twitter


43. tenemos este elemento para medir qué es la polaridad, vamos a suponer yo mando un
44. mensaje en el twitter y necesito saber qué polaridad tiene, es decir, que te mide
45. la polaridad, mide si un mensaje tiene un sentimiento positivo, un sentimiento
46. neutro o negativo, entonces hay herramientas que vamos a ver ahorita que
47. algunas y vamos a ver el rápid mainer que te permiten analizar de todos los
48. tweets que tú has enviado cuáles son positivos cuáles negativos y cuáles son
49. neutros esto básicamente es el análisis de sentimientos en twitter, es decir,
50. estos textos que tú mandas tú los puedes analizar para saber qué polaridad tienen
51. y además de saber si es positivo o negativo o neutro puedes saber a través
52. de la intensidad qué tan positivo es o qué tan negativo es entonces esto
53. también pues te puede ayudar con el análisis que tú realices y más aún tú
54. puedes revisar la emoción ya estamos hablando de herramientas muy
55. sofisticadas porque aquí se requiere clasificar el texto de ese tuit si es
56. algo que denota alegría tristeza o ira entonces imagínense lo complejo de estas
57. herramientas internamente aunque vamos a ver que en
58. el uso nosotros como usuarios pues lo vamos a usar de una forma muy sencilla
59. pero lo que están los algoritmos que están funcionando dentro de todo este
60. software pues es algo muy complejo porque le vamos a dar un texto y nos va
61. a decir si es es una frase positiva negativa o neutra que podemos saber qué
62. tan intenso es esa positivo o negativo y pues habrá algunas herramientas que te
63. dicen también si las va a clasificar entre algunas de estas emociones
64. entonces pues este es un tema muy muy interesante aquí estamos hablando del
65. análisis de sentimientos en twitter.
66.

se demuestra y se explica la Herramienta Tweet mood para análisis de sentimiento.


Con esta herramienta se puede determinar la polaridad de un texto. Se puede
identificar si es positivo, negativo o neutro. Además, permite comparar sentimientos
entre marcas, países, ciudades, empresas, etc.

Asimismo, te ofrece una serie de estadísticas de análisis de sentimientos

1. Miren aquí hay otra herramienta que es este tweetmood, aquí está la página a la
2. cual ustedes pueden entrar y les va a aparecer una pantalla como esta que
3. tiene tres opciones voy a hacer yo también lo mismo voy a entrar a esa
4. pantalla que es esta que tenemos aquí y pues aquí igual te da explicación
5. también es un proyecto de investigación y pues te da tres opciones que tú puedes
6. hacer puedes ver métricas acerca de un tuit o
7. de un texto o de una palabra clave puedes comparar dice por ejemplo si tú
8. quieres comparar a políticos o comparar autos por ejemplo marcas pues puedes ver
9. qué tanto se habla que tan positivo es que hablen de uno que hablen del otro te
10. hace una comparación o te da estadísticas acerca de eso, entonces voy
11. a entrar a la primera y aquí nosotros le podemos dar de algún texto
12. por ejemplo el Wolkswagen jetta le dimos le dimos enter y pues aquí te
13. hace un análisis más completo que el anterior pero vean aquí por ejemplo aquí
14. está el análisis del sentimiento en cuestión de porcentaje entonces aquí te
15. dice que hay es un 25% saca una muestra de tweets que sean aquí si son tweets
16. éste va a la base de datos de los tweets y saca este texto y entonces él saca una
17. muestra, una cantidad de tweets los analiza que es la herramienta que vimos
18. hace un momento está también los analiza y bueno está diciendo que un 25%
19. de lo que eran tweets positivos con sentimientos positivo y un 75%
20. que fueron con sentimiento negativo y también hay una cantidad de
21. tweets que sacó con un sentimiento neutral entonces aquí te muestra en
22. valores acá está en porcentaje pero por ejemplo de los tweets que sacó que es
23. una pequeña muestra que extrae pues aquí están los positivos, los negativos
24. y los neutros entonces ahí también te los muestra te lo muestra de esta manera
25. también aquí por ejemplo va subiendo de negativo a positivo son los que están
26. hasta el punto 5 son los tweets negativos y luego después conforme va
27. aumentando son positivos y aquí está los neutros o sea la subjetividad y la
28. objetividad de ellos también te los muestra de esa manera, tú los puedes
29. aquí ir analizando y te muestra los tweets que fue analizando los que
30. extrajo y el análisis que hizo pues fue de estos tweets que están mostrando aquí
31. entonces aquí tenemos otra herramienta que tú puedes utilizar para ir haciendo
32. pues los análisis de sentimiento en twitter y pues es una herramienta que
33. aunque están en investigaciones pues ambas te pueden dar pues unos primeros
34. resultados para ir pensando en un negocio, en un proyecto pues puedes
35. comenzar con algunas de estas herramientas,
36. esto es lo que estuvimos revisando ahorita aquí
37. pues te dejo un ejemplo que es lo mismo que acabamos nosotros de realizar
38. ahorita.
39.

En el presente video se demuestra y se explica la Herramienta Hootsuite para análisis de


sentimiento. Con esta herramienta se puede determinar la polaridad de un texto. Se puede
identificar si es positivo, negativo o neutro. En general, esta plataforma te permite gestionar
tus redes sociales.

1. Una última herramienta de análisis de sentimiento


2. hootsuite que ustedes pueden consultar en esta página que nosotros mostramos
3. aquí pueden crear esta pues es ya una no es libre es de paga aunque pueden sacar
4. una cuenta gratuita por 60 días que la pueden utilizar la pueden probar y ya
5. después si les parece adecuada pues ya la empiezan a pagar o si no simplemente
6. le dan de baja y se quedan con una versión gratuita pero ya es una
7. herramienta que utilizan empresas serias herramientas potentes más fuertes que
8. ustedes pueden hacer ahí diferentes estilos de análisis y te da una especie
9. de panel de control te da un escritorio y aquí viene una opción de analíticas
10. que tú también puedes consultar de todos tus tweets entonces es muy potente no
11. nada más te analiza twitter te analiza estas diferentes redes sociales que tú
12. des de alta pero aquí te va poniendo diversas métricas todos tus tweets los
13. seguidores aquí está el engagement o sea la interacción
14. tienes a través de tus tweets y parte de eso también vean aquí como te da los
15. mensajes por sentimiento los positivos los negativos y los neutros entonces
16. pues esta herramienta también es muy muy potente
17. voy a abrirla en el navegador y aquí puesto tienes algo como un escritorio
18. que es lo mismo que nosotros veíamos y tienes esta opción aquí que es analítica
19. aquí tú puedes entrar y dependiendo la cuenta con la que tú tengas pues esto te
20. va a cambiar y te va a variar pero tú puedes ir viendo los diferentes reportes
21. que nosotros estuvimos viendo aquí y que tú los puedes ir consultando para que te
22. des una idea y hablando en particular de análisis de sentimientos en twitter esta
23. herramienta también lo considera que puedes hacer el ejercicio de estar
24. monitoreando cómo está reaccionando tus clientes acerca de los mensajes que tú
25. estás enviando, y bien, pues en resumen te pongo aquí todas las
26. métricas que se pueden obtener cuando hacemos un análisis de la actividad de
27. los usuarios en las redes sociales entre todos ellos pues están todos estos
28. mensajes que entran que de acuerdo al sentimiento acuérdense que es la
29. polaridad de que si es positivo si es negativo o si es neutro entonces aquí tú
30. puedes ver en la siguiente pues tenemos más métricas no o sea todo lo que tú
31. puedes revisar en las diferentes herramientas relacionado con la
32. actividad de los usuarios en las redes sociales bien pues aquí termina este
33. vídeo acerca del análisis de sentimiento en twitter
34.

Hay dos tipos de licencias que puedes utilizar en forma gratuita: la licencia
académica, si tienes un correo electrónico de una universidad y, la licencia libre,
que está limitada a 30 días y que la puedes descargar con cualquier correo
electrónico.

1. Vamos a realizar la instalación del Rapid Miner, lo primero que tenemos que
2. hacer es entrar al navegador y aquí vamos a ir a la página del Rapid Miner
3. hacemos la búsqueda entramos a la página entonces vamos a buscar en donde
4. descargar una licencia, hay dos tipos de licencias que nosotros podemos utilizar
5. en este curso la primera es entrar al programa educacional es decir con un
6. correo que nosotros tengamos de una universidad que puede ser de nuestra
7. universidad del anáhuac nosotros podemos bajar una versión que
8. está muy completa y que nos va a durar más tiempo esta versión la podemos usar
9. nosotros para cuestiones académicas nada más le vamos a dar en productos dentro
10. de productos vamos a seleccionar Educational Program vamos a
11. descargarla vamos a darle en comenzar y ahora tenemos aquí la página con los
12. datos que nos pide Rapid Miner el primero es el correo electrónico universitario
13. qué función tienes tú en la universidad nosotros le vamos a dar como estudiantes
14. nombre de la universidad el nombre del curso el número de curso
15. finalización del curso y el nombre del maestro y ahora le vamos a dar descargar
16. como no tenemos una cuenta registrada vamos a registrarnos nosotros
17. seleccionamos venta de tipo educacional ponemos nuestro nombre apellido nuestra
18. dirección de email y vamos a crear nuestro password y le damos en registrar
19. nos han enviado un email y nos dice que tenemos que darle clic para confirmar
20. dentro del email para activar nuestra cuenta entonces vamos a revisar nuestro
21. correo aquí tenemos efectivamente un correo que damos clic y aquí viene y
22. está verificar este correo y le damos clic dice que la cuenta fue creada
23. exitosamente entramos a la pantalla de la licencia educacional aquí nos muestra
24. un mensaje y nos pide información personal
25. entonces seleccionamos un número de teléfono de acuerdo al país le decimos
26. que somos estudiantes le ponemos el correo electrónico que nosotros
27. registramos le ponemos el nombre de la universidad y nos pide una breve
28. descripción para que utilizaremos el Rapid Miner
29. aceptamos las condiciones de la licencia entonces aplicamos aquí te pone un link
30. para descargarlo le vamos a dar click ahí y aquí están
31. ya las opciones dependiendo de tu equipo si entonces le vamos a dar clic en
32. windows 64 bits y empieza a descargar el programa ya terminó la descarga y lo que
33. tenemos que hacer ahora es ir a la carpeta donde está descargado el archivo
34. y aquí está el archivo de instalación del Rapid Miner, vamos a ejecutar ese
35. archivo y ahora sí va a comenzar la instalación te damos siguiente que si
36. estamos de acuerdo en que en qué carpeta lo va a instalar y comienza la
37. instalación
38. bien aquí nos pone la pantalla de que se
39. ha completado y nos dice si queremos abrir inmediatamente el Rapid Miner le
40. damos terminar y aquí ya está abriendo Rapid Miner, nos muestra pantalla de
41. inicio tenemos que aceptar las condiciones y aquí tenemos la pantalla
42. de inicio del Rapid Miner, entonces ya quedó instalado con licencia académica
43. si por alguna razón ustedes no tienen una cuenta de su universidad la opción
44. que tenemos es bajar la versión gratuita son 30 días entonces aquí buscamos la
45. página de Rapid Miner y esta primera opción que dice descargar Rapid Miner el
46. estudio le damos clic aquí y aquí pondrían ustedes su correo electrónico
47. aquí seleccionamos cualquier opción seleccionamos este alguna industria y le
48. daríamos clic en descargar entonces con esto ya tendrían ustedes su versión
49. libre por 30 días
50.

tutorial del software especializado RapidMiner. Se muestra el uso de los


principales módulos y se realiza un ejercicio para ejemplificar las acciones
a realizar.

1. Una vez que hemos realizado la instalación del software Rapid Miner
2. vamos a revisar una breve introducción de cómo utilizarlo, entonces aquí vamos
3. a entrar al software, aquí tenemos la pantalla de inicio, una ventana emergente
4. de ayuda se abre y te muestra tres pestañas, tú puedes empezar con alguno de
5. estos archivos una página en blanco o dos herramientas que trae aquí
6. disponibles estas nuevas versiones de Rapid Miner o bien puedes escoger una
7. práctica ya realizada que le llama templates normalmente cuando vamos a
8. empezar a trabajar empezamos con una en blanco o bien puedes continuar tu
9. trabajo abriendo algunos de los archivos más recientes que tú hayas elaborado o
10. puedes ir a la ayuda algún tutorial por ejemplo operadores y procesos
11. aquí tenemos nosotros una pantalla que nos va llevando poco a poco cómo
12. realizar este ejercicio, aquí estamos nosotros en modo tutorial entonces éste
13. pues ya como parte del tutorial te dice que recuperes la base de datos de
14. titanic por ejemplo tú puedes estar trabajando con todo esto tú tienes aquí
15. disponibles diferentes archivos y así tú puedes ir avanzando le das en siguiente
16. y ahora te dice la siguiente actividad buscar en el repositorio y dice que
17. busques en en 'champions' y dice que arrastres titanic training para ir al
18. siguiente paso tú le das en next y ahora te dice que construyas tu primer proceso
19. se conecta la salida del puerto que se llama out
20. este es el control que nosotros acabamos de poner como arrastrando la tabla se
21. creó este operador que se llama retriever y éste tiene este que es un
22. puerto que puede tener conexiones y este puerto se llama auto esta parte que
23. tenemos aquí nosotros es el panel de proceso entonces este puerto nos pide en
24. esta actividad que nosotros lo conectemos a este puerto que se llama
25. rest cómo lo podemos conectar le vamos a y vamos a generar arrastrar la línea y
26. la vamos a soltar aquí este puerto out se conectó con el puerto red y le vamos
27. a dar en siguiente y me dice que la actividad que hay que hacer es darle
28. clic en el botón que es como un play que es el rom le vamos a dar play
29. aquí tenemos ya la ejecución de play que es lo que hizo es mostrar la tabla que
30. nosotros le dijimos que mostrara que era la del titanic training entonces con eso
31. ya estamos ejecutando nosotros el proceso y le voy a dar en siguiente que
32. bueno se ha determinado la práctica que se hizo bien y con esto termina este
33. ejercicio tras ejercicios que vienen aquí tú los puedes utilizar en cualquier
34. momento para ir practicando paso a paso cómo realizar cada una de las
35. operaciones del Rapid Miner otra forma de trabajar es empezar con una página en
36. blanco esta es la pantalla principal esta es la barra de título que me dice
37. la versión del Rapid Miner y en qué computadora está instalada la barra que
38. sigue es una barra de menú aquí está en todas las opciones que nosotros
39. tenemos disponibles para trabajar con el rapid mainer la barra que sigue es una
40. barra de iconos con las tareas más comunes y estos botones son muy
41. importantes estos dos del lado derecho son como herramientas adicionales de
42. ayuda pero estos dos normalmente todos los ejercicios vamos a estar
43. interactuando entre estos dos botones este es el botón de diseño y este es el
44. botón de resultados la parte principal del rapide mainer es toda esta pantalla
45. en la parte central está lo más importante que es el modelo que yo estoy
46. creando es donde yo voy a estar poniendo los operadores las conexiones y es en
47. donde se va a estar ejecutando todo nuestro modelo en la parte de arriba a
48. la izquierda nosotros tenemos diferentes archivos
49. procesos que vamos a ir guardando un proceso tiene este icono y además
50. podemos tener tablas también tienes algunos ejemplos también tienes procesos
51. si tú entras aquí a procesos aquí te dan unas plantillas que tú puedes utilizar
52. para esos procesos igual tú puedes rescatar archivos para subirlos aquí y
53. poderlos trabajar lo que tienes que hacer es importar ese dato vamos a
54. suponer que tú hiciste la tabla en excel entonces le daríamos importar le dices
55. que está en tu computadora y dentro de tu computadora pues tú vas a poder
56. buscar la tabla seleccionas el archivo y le das siguiente al darle siguiente aquí
57. ya está trayendo de hacer una muestra del archivo que estás tú importando le
58. das siguiente te dice los tipos de cada una de las variables le das siguiente y
59. te dice que lo va a almacenar en el repositorio local con el nombre es le
60. das terminar automáticamente te abre la práctica yo me voy a cambiar el diseño
61. entonces aquí este es el archivo que ahorita lo acabo yo de importar cómo
62. puedo ir armando mi proceso el proceso se empieza a llenar de operadores si yo
63. arrastro aquí una tabla automáticamente detecta y da de alta
64. que es el control de triple es un control y los controles tienen puertos y
65. lo que decíamos que tú lo puedes conectar a los puertos de salida como
66. está aquí y luego lo puedes ejecutar qué más puedo hacer bueno hay varios
67. controles que dependiendo de la práctica tú los vas a poder realizar tú vas a ir
68. buscando aquí te aparece y lo vas a arrastrar lo puedes arrastrar aquí para
69. que automáticamente se conecte o lo puedes arrastrar acá afuera y hacer las
70. conexiones manuales entonces por ejemplo vamos a suponer que lo ponemos aquí y
71. vean como automáticamente se conectó si yo es no lo quiero pues lo puedo
72. seleccionar y le puedo dar suprimir y automáticamente se elimina entonces ya
73. aquí tengo yo dos controles y aquí me genera un árbol de decisión hay otros
74. controles por ejemplo el de gaming es un elemento que tú puedes arrastrar y lo
75. puedes soltar soltar aquí y así puedes ir tú teniendo diferentes controles y
76. puedes tener más de una salida de un elemento para conectarlo en la parte
77. del puerto de salida para mostrar los resultados esta ventana que tenemos aquí
78. me va a servir para dar de alta los controles dependiendo del modelo que yo
79. quiero crear para conectarlos simplemente le doy clic y le doy clic en
80. donde lo quiero conectar y se van realizando las conexiones si yo quiero
81. configurar cada uno de estos controles por ejemplo árbol de decisión lo
82. seleccionó estando seleccionado el control del lado derecho tenemos dos
83. elementos importantes en la parte superior tenemos los parámetros del
84. control que esté seleccionado y también tengo la ayuda correspondiente a ese
85. operador y aquí pues yo puedo tener diferentes elementos que dependiendo lo
86. que yo requiera yo voy manipulando cada uno de estos
87. elementos y le voy poniendo la configuración que yo desee y si yo
88. quiero ver la ayuda inclusive te dice si quieres ir a un tutorial como el que
89. vimos al inicio entonces aquí está una ayuda muy detallada de todo lo que tú
90. puedes hacer con este control en la parte superior en los parámetros
91. también es importante notar que tenemos los parámetros por default algunas veces
92. hay parámetros avanzados que están ocultos en este caso le damos clic y me
93. mostró algunos elementos más para que yo pueda configurar si funciona el
94. ejercicio le doy en resultados y aquí me va mostrando los diferentes resultados
95. que yo puedo tener aquí se van a ir abriendo las ventanas aquí te van
96. mostrando en cajitas todos los diferentes resultados y tú le vas dando
97. clic en el que quieres observar entonces me voy a regresar a diseño aquí en esta
98. parte tenemos nuestro repositorio que es donde están todos los archivos en la
99. parte central es donde tú colocas todos los operadores y realizando todas las
100. conexiones esta parte de la parte de los operadores que tú buscas y tú puedes
101. estar insertando a tu modelo para irlo enriqueciendo cuando tú seleccionas un
102. operador del lado derecho están los parámetros que tú puedes configurar en
103. la parte de abajo a la derecha está la del operador que tú hayas seleccionado y
104. este es el botón importante que es el botón de ejecutar el modelo una vez que
105. tú ejecutas el modelo te va a aparecer la pantalla de resultados y tú vas a
106. poder ver las diferentes tablas o elementos que generó la ejecución y en
107. esta parte que es importante que no se te olvide siempre grabar tu modelo
108. entonces aquí lo podemos grabar el proceso me dice que se va a grabar en el
109. repositorio local y aquí le podemos poner el nombre que tú le quieras poner
110. y con eso se va a grabar entonces esta es la forma en que tú puedes comenzar
a
111. trabajar con el Rapid Miner
112.

se desarrolla paso a paso la práctica de análisis de sentimiento en twitter con el


software especializado RapidMiner.

La práctica se compone de tres etapas, una por cada video.

Etapa 1: Video Extracción de tweets en twitter

1. En esta práctica vamos a revisar el análisis de sentimiento en twitter


2. utilizando el Rapid Miner aquí tengo ya la pantalla de inicio, lo primero que
3. tenemos que hacer es traernos los tweets y esos tweets los vamos a extraer del
4. rapide mainer vamos a insertar el operador para traernos los tweets hay un
5. operador que se llama search twitter este que tenemos aquí
6. dice este operador busca diferentes estatus en twitter entonces este es el
7. que se trae los tweets aquí tenemos el operador
8. este operador yo podría conectarlo directamente a la
9. salida y voy a tratar de ejecutarlo
10. al darle ejecutar me marca aquí y se requiere un parámetro está esperando un
11. parámetro dice que tenemos que ver los parámetros para volverlo a ejecutar
12. qué es lo que necesitamos acá nos indica que tenemos que tener una conexión
13. ahorita no tenemos ninguna conexión es decir tenemos que hacer una conexión a
14. twitter para poder mostrar los tweets entonces vamos a darle clic aquí en el
15. icono de twitter que está aquí a la derecha le voy a dar clic y voy
16. adicionar una nueva conexión entonces lo voy a poner adicionar
17. conexión por default me pone este nombre new conexión lo
18. podemos dejar así aquí podemos revisar dice que va a ser una conexión con
19. twitter que es una red social que está en línea de microblogging services le
20. voy a poner crear aquí está la nueva conexión aquí tenemos un toque
21. que es como una clave para que tú puedas conectarte a twitter dice que hay que
22. abrir esta url para requerir el acceso y hay que copiar ese código aquí entonces
23. le vamos a dar clic le ponemos que queremos autorizar y aquí
24. está el toque lo vamos a copiar y le vamos a dar completa
25. y ya se puso una máscara de asteriscos de que ya está realizada y le voy a
26. poner salvar entonces aquí me regreso como estaba del error que me estaba
27. marcando y seleccionó la conexión ya está seleccionada la conexión le voy a
28. dar ejecutar y me dice que falta un parámetro este
29. parámetro ahora es lo que tú quieres buscar
30. que búsquedas o qué tweets aquí lo que tenemos que poner es sobre qué es lo que
31. quiero yo explorar acuérdense que lo que queremos hacer es un análisis de
32. sentimiento es decir qué polaridad tienen los tweets que están mandando los
33. usuarios acerca de una campaña que hayamos realizado de algún producto de
34. lo que nosotros queramos explorar por ejemplo yo le voy a poner una búsqueda
35. de jetta para que me traiga todos los tweets relacionados con la palabra dieta
36. lo voy a poner ejecutar y aquí están los tweets que extrajo con la cadena dieta y
37. me manda varios campos me manda quien envió cada tweet
38. un haití del usuario si se lo mando a alguien la fuente y aquí está el texto
39. esto que tenemos aquí son los tweets que se enviaron relacionados con la cadena
40. dieta que son los que yo quiero analizar y así cada quien le pondría de lo que
41. quiere analizar y aquí están todos los textos de lo que se ha traído entonces
42. hasta aquí ya extranjero todos los tweets que es básicamente texto y lo que
43. me interesa de todos estos campos es este campo que es el text y lo que se
44. requiere analizar es si tiene una connotación positiva o polaridad
45. positiva negativa o es neutro para que yo pueda hacer mi análisis
46.

Etapa 2: Video Agregar extensión para operador externo de análisis de sentimiento


se desarrolla paso a paso la Etapa 2: Agregar extensión para operador externo de
análisis de sentimiento

Recuerda que para realizar toda la práctica, debes comenzar el ejercicio en


el primer video de Etapa 1: Extracción de tweets en Twitter y continuar con
la misma práctica durante el segundo y el tercer video.

Nota: Es probable que te aparezca una alerta (warning), indicándote que


ya no se le dará soporte a la extensión que se utiliza en la práctica
mostrada en el video. Debes hacer caso omiso de esa alerta, o bien, realizar
este mismo procedimiento para utilizar la otra extensión que se te sugiere
en la alerta, sin embargo, también te mandará la misma alerta con la otra
extensión. Considera que son extensiones gratuitas y que por eso envían
estas alertas, pero las extensiones funcionan correctamente y NO se trata
de errores.

1. En esta práctica vamos a revisar el análisis de sentimiento en twitter,


2. voy a insertar ahora el operador que me va a permitir analizar todos esos tweets
3. ahorita este me los trajo así que viene a reemplazar la tabla de datos que
4. normalmente usamos me la traigo directamente de twitter aquí la tengo ya
5. y de aquí me voy a ir a analizarlos con que lo analizamos hay un operador que me
6. permite analizarlos ese operador se llama análisis
7. así se llama el operador pero no lo tenemos disponible aquí nosotros
8. entonces lo que tenemos que hacer es agregarlo lo vamos a agregar como le
9. podemos hacer es una extensión el rápido mainer te permite agregar nuevos
10. operadores que han sido desarrollados por otros otras empresas entonces si yo
11. me voy aquí a extensiones y me voy al catálogo de extensiones
12. la que yo voy a agregar que es la que me permite extraer los tweets pero su campo
13. de texto nada más la columna de texto sin todos los demás datos y hay una
14. empresa que se llama Aylín, voy a buscar y este es un operador que me permite
15. hacer procesamientos de texto entonces lo seleccionó le digo que lo quiero
16. instalar que quiero instalar el paquete y le voy a dar aceptar
17. y aquí lo que nos indica es que para que pueda funcionar
18. debemos reiniciar el Rapid Miner le vamos a poner que si lo queremos
19. reiniciar la práctica que estábamos haciendo hasta
20. el momento no se ha guardado lo podemos poner que si la queremos guardar
21. y entonces se va a reiniciar el Rapid Miner para poder utilizar esa extensión
22. y vamos a abrir nuestro repositorio local y vamos a abrir la práctica de
23. sentimiento en twiter y ahora queremos sacar nada más la columna del texto del
24. tweet y para eso instalamos de la empresa agilent una extensión y queremos
25. utilizar ahora un operador que se llama análisis de sentimiento y aquí lo
26. tenemos es este
27. entonces este lo podemos directamente soltar aquí y se va a conectar vamos a
28. ejecutarlo dice que está esperando un parámetro dice que le demos clic en
29. análisis de sentimiento para desplegar sus parámetros los parámetros lo
30. despliega acá a la derecha lo voy a seleccionar
31. nos está pidiendo una conexión para este dice que si ya hemos confirmado la
32. colección tu puedes seleccionar la de la lista entonces le voy a dar cancelar y
33. voy a crear ahora una conexión pero con la empresa con aire aquí lo mismo que
34. hicimos ahora le voy a dar clic aquí
35. le voy a dar clic y voy a adicionar una conexión puede decir que es una nueva
36. conexión con esta empresa y aquí nos pone lo voy a copiar lo voy a poner
37. crear y aquí nos pide que nos registremos para
38. que nos pueda dar el acceso entonces me voy a registrar y ya me registre dice
39. que ahora debimos haber recibido por mail las instrucciones para utilizar
40. esta clave para activarla y aquí tengo dos correos
41. hay quien dice que activar la cuenta y que se ha creado una nueva clave
42. entonces este es el primer correo que llegó y dice que se ha creado una nueva
43. clave voy a ponerle aquí mi correo y el
44. password aquí hay una nueva clave la voy a
45. y me voy a ir a Rapid Miner aquí está la clave y nos pide un haití
46. de la aplicación y aquí está una idea que vamos a copiar
47. aquí tenemos con esta conexión que es con la empresa ailén lo voy a poner
48. salvar entonces ahora voy otra vez a seleccionar y lo voy a decir que ya
49. tengo una nueva conexión que se llama conexión 2 vamos a probar
50. y me dice tenemos que poner un atributo de entrada
51. aquí nos está pidiendo un atributo de entrada vamos a seleccionar y le vamos a
52. poner lo que yo quiero luego sí quiero el
53. texto por ejemplo que es el texto de tweet si quiero el aire y del tuit el
54. que usuario viene aquí me dice todo lo que se puede traer le digo que quiero el
55. texto
56. voy a dar ejecutar
57. y aquí tenemos el resultado del análisis del sentimiento
58.

Etapa 3: Video Interpretación del análisis de sentimiento en twitter


Recuerda que para realizar toda la práctica, debes comenzar el ejercicio en el
primer video de Etapa 1: Extracción de tweets en Twitter y continuar con la misma
práctica durante el segundo y el tercer video.

1. En esta práctica vamos a revisar el análisis de sentimiento en twitter


2. voy a regresar al diseño para recordar este no se extrae todos los tweets con
3. todas las columnas relacionadas con el tweet desde el usuario la fecha el texto
4. que lo mandó y este operador agarra toda la tabla y analiza la columna del texto
5. para saber la polaridad de cada uno de ellos
6. no voy a resultado y aquí tenemos la tabla esta es la polaridad aquí tenemos
7. recuerden si es positivo negativo o neutral y acá tenemos el texto que es la
8. columna que nosotros seleccionamos para analizar le dijimos que analizará el
9. texto y por ejemplo de este tweet que es este texto lo pone por ejemplo que es
10. positivo el que sigue es en una de las 'águilas' entonces este también es
11. positivo y algunos que no no se puede identificar cuál es la intención
12. cuál es su polaridad se les pone neutrales y aquí tenemos entonces todas
13. las las polaridades de cada uno de los tweets que se extrajeron
14. y puedo ir a estadísticas por ejemplo aquí está la polaridad
15. si yo le doy clic aquí me dice neutrales por ejemplo 51 positivos 25 negativos 24
16. y aquí me da la gráfica entonces aquí la tengo los positivos los
17. neutrales y los negativos entonces con esto puedo hacer un análisis de
18. sentimiento en tweeter basado en una búsqueda que yo haga sobre alguno de mis
19. productos sobre una campaña que yo realice qué es lo que se está hablando
20. de nuestra empresa entonces puede utilizar esta esta práctica para
21. realizarlo recuerden que hay que dar de alta una conexión para poder traernos
22. los tweets y dar de alta otra conexión con esta empresa para poder realizar el
23. análisis de sentimiento y este es el resultado del análisis de sentimiento en
24. twitter
25.

Resumen

● El procesamiento del lenguaje natural (PLN), es un campo de las ciencias de


la computación, inteligencia artificial y lingüística que consiste en las técnicas
de representación del lenguaje humano y estudia las interacciones entre las
computadoras y el lenguaje humano.
● El PLN del lenguaje natural hablado o escrito, todavía no logra una exactitud
total, debido a los problemas de ambigüedad y estructura del lenguaje.
● La estructura del lenguaje se analiza en cuatro niveles, que son los
elementos de un PLN: análisis morfológico, sintáctico, semántico y
pragmático.
● El PLN se lleva a cabo mediante las técnicas de lingüísticas formales y
probabilísticas; así como por los modelos lógicos (gramáticas) y
probabilísticos (basados en conjunto de textos).
● Algunas aplicaciones del PLN son las siguientes: filtros anti-spam, control de
contenidos infantiles, clasificación automática de correos, clasificación
automática de documentos y Análisis de sentimientos.
● El RapidMiner permite realizar análisis de sentimientos en Twitter en forma
rápida y sencilla.

se muestra una introducción a la sección de árboles de clasificación. Se


describen sus conceptos y se mencionan los temas a abordar y los resultados
esperados.

1. Vamos a iniciar la sección de árboles de clasificación.


2. Los árboles de decisión, representan uno de los modelos de minería de datos más
comunes
3. y estudiados son fáciles de construir y de interpretar. Un tipo de árboles de
4. decisión son los árboles de clasificación, que clasifican los datos
5. del conjunto de entrada tomando como base una variable clasificadora
6. categórica, es decir que toma un conjunto finito de valores esto es, por ejemplo,
7. que puede valer solamente si o no. Las aplicaciones de árboles de clasificación
8. son muy variadas, por ejemplo, se utilizan en las predicciones de siniestros en
9. abandono de clientes en logro de metas de producción o bajas de alumnos en el
10. sector educativo.
11. Los temas que revisaremos en esta sección son los
12. siguientes: Introducción a los árboles de clasificación, La técnica de los árboles
13. de clasificación, Aplicaciones de los árboles de decisión, Ejercicio práctico
14. de clasificación. Con el estudio y práctica de los contenidos, podrás
15. comprender los conceptos de árboles de decisión, analizar la técnica de estos
16. árboles y aplicarla. En esta sección también vamos a realizar prácticas con
17. el software RapidMiner
18.
se muestra una introducción a los árboles de decisión. Asimismo, se observa la
relación de los árboles de decisión con la analítica predictiva como su
principal aplicación.

1. La modelación predictiva permite descubrir patrones de comportamientos de


2. clientes, productos, servicios y competidores para generar estrategias
3. que permitan tomar decisiones basadas en los conocimientos generados.
4. La predicción de estos patrones se logra mediante la aplicación de algoritmos y
5. técnicas como los árboles de decisión. La modelación predictiva se puede
6. implementar mediante la minería de datos con el apoyo de este software
7. especializado. El árbol de decisión es el modelo de clasificación más utilizado
8. debido a su enorme potencial para la predicción y a su simplicidad y
9. facilidad de entendimiento, mediante estos árboles se pueden construir
10. modelos que se interpretan analizando las diferentes variables que están
11. consideradas en este modelo en las diversas ramificaciones del árbol.
12. En esta unidad se analizará el funcionamiento de estos árboles de
13. decisión y se utilizará el software especializado RapidMiner para realizar
14. una práctica del diseño de un modelo predictivo basado en un árbol de
15. decisión para proponer el diseño de un esquema de mejora del proceso que apoye
16. a las decisiones estratégicas. Los temas que se desarrollarán en esta unidad son
17. los siguientes: Introducción a los árboles de decisión y Aplicación de los
18. árboles de decisión con el software RapidMiner.
19. Los objetivos específicos son:
20. Comprender el algoritmo de árboles de decisión para identificar las
21. oportunidades de su aplicación, utilizar el software RapidMiner para diseñar
22. modelos predictivos que mejoren los procesos, realizar una práctica con el
23. software RapidMiner con la técnica de árboles de decisión para diseñar
24. estrategias que permitan lograr una ventaja competitiva.
25. Recuerda la siguiente frase de Lee Lacocca: "Incluso una decisión correcta es incorrecta
26. cuando se toma demasiado tarde."
27. En este mundo de alta competencia las empresas
28. deben tomar decisiones en forma constante, rápida y eficaz.
29. La predicción, como los árboles de decisión le permiten a las empresas tomar decisiones
basadas
30. en datos sobre predicciones del futuro lo cual los pondrá a la vanguardia en el mercado.
31. El software especializado en minería de datos, como el RapidMiner, les
32. permitirá disminuir drásticamente el tiempo de generación de los modelos
33. por lo que podrán tener predicciones en muy corto tiempo
34.
se muestra una explicación acerca de los árboles de decisión.
Asimismo, se describe el concepto de árboles de clasificación y los
lineamientos generales de su estructura. Finalmente, se
mencionan las etapas generales que se deben considerar en la
aplicación de este modelo.

1. El árbol de decisión se conoce como Cart es un tipo de aprendizaje de máquina se


2. utiliza para predecir valores, los árboles de decisión que clasifican los
3. datos del conjunto de entrada en función de una variable clasificadora categórica,
4. es decir, que toma un conjunto finito de valores se les llama árboles de
5. clasificación, si la variable es continua hablaríamos de árboles de regresión.
6. Los árboles de decisión son uno de los modelos más utilizados en la práctica su
7. interpretación y evaluación también es sencilla, pueden combinar variables
8. numéricas y categóricas en el mismo modelo. Su implementación práctica se
9. reduce a una serie de reglas que pueden ser fácilmente escritas como un conjunto
10. de sentencias del tipo si entonces. Los árboles de decisión son modelos de
11. minería de datos, en su funcionamiento subdividen los datos para generar grupos
12. separados de datos de forma que todos los que pertenezcan a un mismo grupo
13. sean de la misma clase, la cual es utilizada como
14. de dicho grupo o región. Si una región contiene datos de diferentes clases es a
15. su vez subdivididas en subgrupos o subregiones más pequeñas siguiendo el mismo
16. criterio hasta separar todo el espacio de entrada en regiones y subregiones
17. separadas que solamente contienen elementos de una misma clase. Los árboles
18. de decisión se utilizan en sectores como el bancario y las compañías aseguradoras
19. para tomar decisiones respecto sobre la concesión de créditos o el cálculo de
20. las pólizas dado que permiten determinar qué características relativas a los
21. usuarios son las de mayor o menor riesgo siendo posible segmentar a los usuarios
22. en función de dichas características. Es importante considerar que cuando se
23. realiza una práctica de creación de un modelo de predicción con árboles de
24. decisión se deben llevar a cabo diferentes etapas en forma ordenada como
25. el diseño del modelo la evaluación y la implementación, las herramientas
26. especializadas para llevar a cabo estas etapas son muy útiles
27. ya que ahorran una gran cantidad de tiempo
28.

se muestran los conceptos relacionados con los árboles de


clasificación, su estructura y su funcionamiento. Así como también, se
explica el operador que se utiliza para su construcción en el software
RapidMiner.

Funcionamiento de los árboles de decisión - clasificación. Parte 1


1. Vamos a comenzar con el siguiente vídeo habla acerca de los árboles de
2. clasificación en particular cómo funcionan estos árboles
3. bien vamos a comenzar en primer término tenemos el concepto de árboles de
4. decisión que dice que es uno de los modelos de minería de datos más comunes
5. y que más se han estudiado porque porque tiene una alta capacidad para explicarse
6. es decir la forma en que nosotros podemos interpretar este árbol
7. es sencilla entonces es la forma en que funciona un árbol de decisión nos
8. permite realizar una fácil interpretación de este modelo que se ha
9. generado y gracias a eso pues es muy utilizado este modelo de árboles de
10. decisión ahora bien hablamos de árboles de decisión y mencionamos árboles de
11. clasificación en qué consiste esto bien pues el término general es árboles de
12. decisión dentro de los árboles de decisión hay una clasificación que se
13. divide en dos que son los árboles de clasificación y los árboles de regresión
14. ahora bien en qué consisten los árboles de clasificación dice son árboles de
15. decisión que se clasifican los datos del conjunto de entrada en función de una
16. variable categórica es decir una variable que toma un conjunto finito de
17. valores entonces un tipo de árbol de decisión es el árbol de clasificación y
18. la característica principal de un árbol de clasificación es que actúa como un
19. árbol de decisión nada más que la variable
20. se va a clasificar la variable que se va a predecir es una variable de tipo
21. categórica que puede valer un conjunto de valores vamos a suponer es sobrevivió
22. es una variable categórica las respuestas a sobrevivió a los posibles
23. valores de sobrevivió es sí o no entonces es un conjunto finito de
24. valores sí o no entonces y es de tipo categórica por el tipo de dato entonces
25. estos son los árboles de decisión en particular árboles de clasificación hay
26. otro tipo de árboles de decisión que le llamamos árboles de regresión estos
27. árboles de regresión consisten en un árbol de decisión en que la variable
28. clasificadora es continua es decir la variable que yo voy a
29. predecir en este modelo no es categórica sino que es una variable continua es
30. decir puede tomar valores 1, 1.1,1.2, 1.3, 1.4, 5, 10, 15,
31. esa es la variable clasificadora, entonces tu puedes predecir, por ejemplo,
32. las ventas o el número de fallas, entonces aquí pues son variables de tipo
33. continuas
34. bien entonces los árboles de decisión son un modelo de minería de datos que
35. intenta subdividir el espacio de datos de entrada para generar regiones
36. distintas de forma que todos los elementos que pertenecen a una misma
37. región sean de la misma clase, la cual es utilizada como representante de dicha
38. clase entonces yo tengo un conjunto de datos aquí de entrada a este modelo y
39. trata de dividir, dice regiones distintas entonces esta entrada de datos trata de
40. separarla hay ciertas variables que te dicen si si las separadas o si no las
41. separadas entonces lo que trata el árbol es de ir separando entonces aquí tengo
42. un gran conjunto de datos que dentro de ese conjunto de datos tienen diferentes
43. características entonces aquí lo empiezo a separar por ejemplo en dos o en tres
44. elementos, también es otra variable cuántas ramas, cuántas separaciones haces
45. aquí, a cuántas ramas le pones a este árbol entonces este dato de entrada tú
46. lo vas a separar en diferentes subconjunto de datos que le estamos
47. llamando generar regiones disjuntas de tal manera que todos los elementos de
48. esta rama pertenezcan a una misma clase por ejemplo si yo tengo aquí una entrada
49. de datos aquí puedo separar en hombres y en mujeres por ejemplo entonces todos se
50. van a venir para acá todos los que tienen la característica de que son
51. hombres y para acá todos los que tienen la característica de que son mujeres
52. entonces básicamente eso es lo que contiene este árbol de decisión
53. dice si una región contiene datos de diferentes clases es subdividida en
54. regiones más pequeñas entonces por ejemplo vamos a suponer aquí tengo los
55. datos de entrada dijimos aquí voy a poner los hombres aquí las mujeres si
56. aquí dentro de los hombres todavía hay otras características a lo mejor de la
57. edad en donde la edad me puede decir que que es muy variable o sea unos adultos
58. mayores hay unos niños por ejemplo entonces yo puedo subdividir entonces
59. voy a particionar y así me voy a ir particionando particionando mientras
60. haya variables diferentes claro que hay otro dato que me va a decir en qué
61. momento o cuando me conviene ya dejar de particionar este conjunto de entrada
62. un árbol de decisión es una secuencia de condiciones que son interrogadas con
63. respecto a los datos de entrada tomando una decisión parcial que lleva hacia una
64. rama u otra repitiendo este proceso hasta llegar a una hoja donde se toma
65. una decisión final entonces esto es en conclusión yo tengo un conjunto de datos
66. el cual voy a tomar decisiones por ejemplo hombres y mujeres, son hombres
67. los mandó para acá, mujeres los mandó para acá y de estos hombres voy a preguntar
68. son adultos o son niños los mando para acá los adultos los mando para que a los
69. niños y así voy a ir yo repitiendo este procedimiento ahora dice la profundidad
70. máxima de un árbol de decisión es el máximo número de condiciones que es
71. necesario resolver entonces cuántas preguntas voy a hacer aquí para hacer
72. una partición esa es la profundidad que me va a dar
73. este árbol

Funcionamiento de los árboles de decisión - clasificación. Parte 2


1. Bien ahora vamos a platicar acerca de la estructura de los árboles de
2. clasificación entonces en primer término tengo 12 hoja o nodos terminales después
3. tengo nodos internos o splits y tengo el nodo raíz bien este es un ejemplo vamos
4. a suponer un esquema de lo que sería un árbol de decisión en particular un árbol
5. de clasificación me voy a regresar a la terminología en donde dice que esta
6. estructura tiene nodos hoja 12 terminales 12 internos y no de raíz bien
7. voy a comenzar con el nodo raíz contrariamente al concepto de árbol que
8. nosotros tenemos que la raíz está hasta abajo este modelo de árboles de
9. clasificación tienen los árboles de decisión en general el nodo raíz está en
10. la parte superior dice es el nodo superior cuando se presenta un nuevo
11. dato a un árbol de decisión se empieza por el nodo raíz que contiene una
12. condición la cual determina por qué rama del árbol debe descender se bien
13. entonces uno es el nodo raíz de todo el árbol
14. entonces tiene estas dos ramas la rama hombres y las ramas mujeres dado por la
15. variable sexo entonces aquí el nodo 2 es un subárbol que yo pudiera considerar
16. que el nodo 2 es el nodo raíz de los nodos 4 y 5 pero como tal todo esto es
17. una rama entonces todo esto es es un nodo intermedio de todo el árbol general
18. si quisiera analizar nada más esta parte del árbol entonces si se fijan tiene la
19. misma estructura del nodo general tiene un nodo raíz y tiene otros nodos y tiene
20. una variable que lo divide que por ejemplo edad y para acá tengo niños y
21. para acá tengo adultos entonces este es el nodo raíz de todo el árbol luego dice
22. tengo 12 internos o splits representan condiciones que permiten decidir a qué
23. supresión va a cada elemento que llega a dicho nodo entonces yo dije que este era
24. mi nodo raíz y estos son los nodos que yo voy a irme encontrando en el camino
25. que como ven se llaman nodos o splits entonces esto este 2 es un nodo
26. interno el 3 es un nuevo interno y el nodo raíz es el nodo 1
27. y luego tengo 12 hojas o terminales representan regiones etiquetadas o
28. clasificadas de acuerdo a una clase en la parte final del árbol como ya no hay
29. subdivisiones a esto se les llama nodos hoja como vemos aquí se pueden llamar
30. nodos hoja o nodos terminales esto representaría en estos últimos nodos el
31. 4 el 5 el 6 y el 7 entonces esta es la estructura del árbol tiene un nodo raíz
32. tiene nodos intermedios el nodo raíz es el 1 el 2 y el 3 son nodos intermedios y
33. los nuevos hojas o terminales el 4 el 5 el 6 y el 7 entonces así es como está la
34. estructura de este árbol de decisión en particular árbol de clasificación porque
35. recuerden que la variable aquí que esta partición 'no es de tipo categórica sexo
36. que vale hombres o mujeres edad que vale niños o adultos clase que vale primera y
37. tercera ahora bien si yo tengo aquí cómo
38. entender cómo lo va a partición 'no vamos a suponer que este es el ejemplo
39. como lo tenemos aquí de supervivencia de los pasajeros del titanic bien entonces
40. supongamos que en total eran dos mil 201 pasajeros entonces estos son los datos
41. que van a entrar aquí y de estos datos que entran mil cuatrocientos noventa no
42. sobrevivieron y 711 si sobrevivieron entonces no sobrevivieron el 67.7 por
43. ciento y si sobrevivieron el 32.3 por ciento entonces de éstos yo hago una
44. primera partición de acuerdo al sexo y mando hacia acá los que son hombres ya
45. sacar los que son mujeres supongamos que hombres fueron en total mil 731 ahora
46. bien de éstos no sobrevivieron 1.364 y si sobrevivieron 367 y hacia el otro
47. lado yo tengo visión de mujeres y en total fueron 470
48. mujeres no sobrevivieron 126 y si sobrevivieron 344 y así yo voy partición
49. ando acá en las mujeres partición o por clase y en los hombres puedo particionar
50. por edad entonces de niños cuántos niños fueron 64 niños aquí están los que no
51. sobrevivieron y los que si sobrevivieron acuérdense que la variable categórica
52. aquí o sea la que estoy prediciendo es la variable de sobrevivió o no
53. sobrevivió acá tengo a los adultos que fueron mil 667 en total no sobrevivieron
54. mil 329 y si sobrevivieron 338 en las mujeres tengo una división por clase o
55. sea en qué nivel estaban viajando en primera o en tercera clase entonces yo
56. tengo aquí que 196 se fuera una tercera clase y 274 se fueron la primera clase
57. y de estas de las 274 no sobrevivieron 20 pero si sobrevivieron 254 que es el
58. 92.7 por ciento entonces si observamos aquí en estos nuevos terminales quienes
59. tienen el mayor porcentaje de sobrevivencia aquí tenemos el 45.3 el
60. 20.3 que son este hombres adultos sobrevivieron 20.3 hombres niños
61. sobrevivieron 45.3 mujeres en clase tercera sobrevivieron 54.1 mujeres en
62. clase 1a sobrevivieron 292 punto 7% entonces las que más probabilidades
63. tienen de sobrevivir son las que son mujeres y que viajan en clase de primera
64. porque tienen un 92 puntos 7 por ciento en esta variable entonces así es como se
65. va analizando este árbol de decisión en particular árbol de clasificación

Funcionamiento de los árboles de decisión - clasificación. Parte 3


1. Vamos a repasar los criterios para la construcción de un árbol bien el primero
2. es el criterio de parada que se domina acp y se determina en qué momento se
3. deja de seguir seleccionando nodos para ser subdivididos este mismo ejemplo del
4. del árbol y yo tengo aquí el nodo principal que es el 1 que es el nuevo
5. raíz tengo los nuevos 2 o 3 o sea entonces yo voy a tener un criterio que
6. es el de parada que me dice que ya no voy a seleccionar más nodos es decir ya
7. en el 6 ya no voy a seleccionar más nodos hasta aquí se va a detener este
8. este árbol entonces es uno de los criterios cuando voy a construir otro
9. árbol otros el criterios de selección determina qué nodo es seleccionado para
10. ser particionado en dos o más sub no 2 entonces del 1 yo tengo que decir hacia
11. cuál nodos me voy a ir depende de mi variable
12. entonces la variable que yo tengo es la forma en que yo voy a ir avanzando en
13. este árbol entonces ese es el criterio de selección el criterio de
14. clasificación determina qué clase asigna a un nodo hoja normalmente se
15. trata de una clase que minimiza el error de clasificación entonces yo voy a
16. dividir aquí voy a decir este nodo lo voy a dividir pero tengo que definir
17. bajo que el criterio lo voy a dividir en este caso lo estoy dividiendo bajo la
18. variable sexo y estoy separando en hombres y en mujeres
19. estoy este lo divide y bajo la variable edad y los separos niños y adultos
20. y finalmente tengo el criterio de partición o cd y se determina cómo se
21. partición ao nodo en dos o más sub no dos normalmente los árboles son binarios
22. es decir cuando vale dos que decir que tengo en dos partes los voy a dividir
23. indicando que cada región se subdivide en dos regiones distintas entonces con
24. este criterio de partición pues yo voy a decir este uno no de raíz lo voy a
25. particionar en dos vale dos y unas van a ser los hombres y
26. otros van a ser las mujeres entonces estos son los criterios para la
27. construcción de los árboles si tengo el criterio de parada o cp criterio de
28. selección o se ese criterio de clasificación cc y criterio de partición
29. se ve finalmente vamos a revisar en rapid mainer que es el software
30. especializado que nosotros vamos a utilizar el operador que vamos a usar
31. para construir estos árboles es el operador árbol de decisión y se este
32. operador se utiliza para generar un modelo de árbol de decisión se pueden
33. procesar con de ejemplos o de datos que contienen
34. atributos nominales o numéricos entonces recordemos que hay dos tipos de árboles
35. los árboles de clasificación y los árboles de regresión entonces con este
36. operador el árbol de decisión yo puedo generar
37. los dos tipos de árboles y que va a recibir como entrada pero se va a
38. generar va a procesar un conjunto de una tabla de datos que yo le voy a dar aquí
39. como entrada a este control a este operador aquí me va a generar el árbol y
40. aquí tengo la salida que es el árbol el modelo que es el árbol de decisión que
41. se generó y la tabla de datos también la puede observar entonces este es el
42. control operador que yo voy a utilizar para en rapid mainer en particular para
43. generar este árbol de decisión bien pues hasta aquí y les dejo las referencias
44. por si quieren profundizar en este tema
45.

se muestran los conceptos de entrenamiento y prueba de modelos de


árboles de clasificación. Se explica el proceso de construcción y validación
del modelo y se detallan las etapas de entrenamiento y prueba.

También, se muestra el funcionamiento de los operadores


correspondientes del software RapidMiner.

Entrenamiento y prueba - Parte 1

1. Bien, en este vídeo vamos a revisar cómo se lleva a cabo el entrenamiento de los
2. datos y cómo se prueba el modelo que se genera derivado de ese entrenamiento
3. bien para la construcción del modelo de árboles de clasificación se llevan a
4. cabo las siguientes etapas generales la primera es preparación de los datos qué
5. quiere decir que yo tengo las tablas de datos pero no siempre son adecuadas para
6. generar inmediatamente el modelo sino que tienen tengo que hacerles algún
7. tratamiento por ejemplo quitar los nulos los vacíos los blancos seleccionar las
8. tablas las columnas o variables que yo quiero que entren al modelo eliminar las
9. que no necesito entonces hay una serie de operaciones ahí que se le llama
10. preparación de los datos ya que tengo los datos listos y preparados estos
11. datos los tengo que entrenar entonces tengo que llevar a cabo una operación de
12. entrenamiento que es ir aplicando el modelo aplicando el modelo con varios
13. conjuntos de datos para ir ajustando este modelo una vez que ya tengo ese
14. modelo voy a probarlo cómo lo pruebo pues le voy a aplicar el modelo
15. nuevos datos diferentes a los que yo usé en el entrenamiento entonces pruebo el
16. modelo y ya que probé el modelo tengo que evaluarlo es decir con una matriz de
17. confusión yo tengo que ver qué tanta exactitud tiene mi modelo y esto lo
18. puedo observar en esta etapa de evaluar el modelo y finalmente utilizar este
19. este modelo entonces el objetivo es asegurar que los modelos construidos a
20. partir de los datos disponibles funcionan correctamente para nuevos
21. datos que haya que procesar en un futuro es decir asegurar que el modelo es
22. válido y es capaz de ser usado en producción entonces ellos tengo que
23. asegurarme que el modelo que yo genere va a funcionar para cualquier conjunto
24. de datos nuevos no entonces eso es lo que yo tengo que cuidar al construir un
25. modelo ahora la parte de entrenamiento de los datos dice un algoritmo de
26. aprendizaje un modelo debe funcionar correctamente para los datos de prueba o
27. para nuevos datos es decir yo voy a generar un modelo con un conjunto de
28. datos entonces esos datos se les llama datos de prueba
29. una vez que ya tengo el modelo ya digo este es mi modelo lo voy a aplicar a
30. nuevos datos que tienen que ser datos diferentes a los datos que yo utilicé
31. entonces normalmente en esta etapa de entrenamiento yo toda la tabla la ha
32. dividido en dos partes que son datos de prueba y datos nuevos entonces con los
33. datos de prueba hago el entrenamiento para generar el modelo y con esos datos
34. nuevos aplico ese modelo se debe evitar que sea dependiente el modelo de los
35. datos utilizados durante su entrenamiento evitando el problema
36. conocido como sobreentrenamiento entonces yo tengo un conjunto de datos
37. de prueba con el que generó el modelo y para eso es el modelo funciona muy bien
38. y si yo para el nuevo conjunto de datos no funciona bien quiere decir que ya
39. estoy en este problema de sobreentrenamiento porque en mi modelo
40. nada más funciona muy bien para los datos de prueba pero con datos nuevos no
41. funciona entonces dice este problema de sobreentrenamiento consiste en que el
42. modelo sólo responda estrictamente a las propiedades
43. el conjunto de datos de entrenamiento nada más va a funcionar muy bien para
44. los datos de entrenamiento y será incapaz de aplicarse con niveles de
45. aciertos adecuados a otros nuevos conjuntos de datos que puedan aparecer
46. en un futuro entonces eso no es lo que queremos lo que queremos es crear un
47. modelo claro que tengo que utilizar datos y datos para generar ese modelo
48. pero una vez generado ese modelo pues me va a servir para nuevos datos e
49. inclusive va a volver a actualizarse mi modelo de acuerdo a esos nuevos datos
50. proceso de creación y validación del modelo para los algoritmos supervisados
51. es necesario contar con un conjunto de datos de entrenamiento y otro conjunto
52. de datos de prueba entonces yo tengo una tabla de datos que va a entrar aquí esa
53. es mi entrada vamos a suponer son dos mil 201 pasajeros del titanic esa es mi
54. tabla todos esos datos van a entrar aquí entonces yo voy a dividir la tabla en
55. datos de entrenamiento que lo voy a tener aquí y en datos de prueba entonces
56. yo puedo decir el 70 por ciento de esos 201 van a ser datos de entrenamiento y
57. el 30% van a ser datos de prueba entonces con el 70% yo lo meto al
58. algoritmo de aprendizaje que puede ser el árbol de clasificación y con eso me
59. va a generar el modelo es decir nueva a generar el árbol una vez que yo ya tengo
60. generado este árbol voy a utilizar el 70% que mencioné que iba a dejar para
61. prueba que son datos nuevos y con eso voy a aplicarles el modelo y derivado de
62. eso voy a hacer una prueba para ver qué tanta precisión tuvo este modelo
63. entonces así es como está la estructura y aquí lo tenemos dice se utiliza un
64. conjunto de datos de entrenamiento para crear el modelo supervisado entonces
65. aquí tengo yo los datos de entrenamiento que puede ser ese 70% el conjunto de
66. datos de prueba se utiliza para medir la precisión alcanzada por el modelo el 30
67. por ciento restante de los datos lo voy a dejar para las pruebas el modelo se
68. forma mediante la repetición interactiva de entrenamiento y verificación hasta
69. conseguir los niveles de precisión y de capacidad de
70. predicción aceptables entonces yo voy a estar jugando con los datos de
71. entrenamiento aplicando el algoritmo por ejemplo el de árboles de clasificación y
72. voy a generar el modelo y lo voy a ir ajustando y ajustando y ajustando con
73. otro dato con otro dato entonces a esto se le llama estar entrenando entrenando
74. el modelo una vez que ya utilice el 70% de los datos genera un modelo y digo
75. este es el mejor modelo dado estos datos de prueba este es el mejor modelo
76. entonces lo voy a aplicar para unos datos nuevos y voy a evaluar qué tan
77. bueno entonces toda esta fue la etapa de entrenamiento o training y toda esta fue
78. la etapa de prueba que es el testing entonces esto es lo que se hace en la
79. parte de entrenamiento y de prueba ahora bien como divido yo la tabla inicial que
80. es el 100% de los datos como digo estos van a ser para entrenamiento y estos van
81. a ser para la prueba bien dice los conjuntos de datos de entrenamientos de
82. pruebas suelen ser extracciones aleatorias del juego de datos inicial es
83. decir aleatoriamente yo voy a hacer unos actos para pruebas y otros datos
84. para entrenamiento y se en función del número de datos disponibles existen
85. diferentes técnicas para la creación de los dos conjuntos del de entrenamiento y
86. el de prueba entonces por un lado van a ser aleatorias pero por otro lado qué
87. porcentaje se queda en entrenamiento y qué porcentaje se queda en prueba y
88. entonces hay algunas de las más usadas estrategias más usadas dice una parte de
89. la tabla para entrenamiento y la otra para eventos de 70% para entrenamiento y
90. 30% para prueba otra es que vas a dividir la tabla en subconjuntos por
91. ejemplo en cada conjuntos y vas a entrenar los datos con las que menos 11
92. conjuntos y vas a probar el modelo con el último conjunto vamos a suponer que
93. tengo un acá igual a 10 y yo tengo mil registros ahí o sea tengo mil datos de
94. entrada entonces si acá vale 10 yo voy a generar 10 conjuntos de 100
95. datos cada uno y todo lo voy a hacer en forma aleatoria entonces voy a tener yo
96. 10 y cada conjunto va a ser de 100 datos en
97. total tengo mil datos y qué voy a hacer dice voy a entrenar los datos con k
98. menos 1 conjuntos entonces yo tengo 10 más uno con nueve conjuntos yo voy a
99. estar entrenando entrenando entrenando y con el último conjunto el que no utilice
100. con este voy a aprobar aprobar el modelo entonces esa es otra forma de hacerlo
101. otra dice todos los datos menos uno para entrenamiento y si el dato no usado
para
102. prueba entonces yo voy a agarrar todos los datos a excepción de uno y con eso
103. os voy a entrenar el modelo y solamente voy a dejar un dato para realizar la
104. prueba entonces estas son las diferentes formas o técnicas que yo puedo utilizar
105. para dividir la tabla en datos de entrenamiento y datos de prueba
106.

Entrenamiento y prueba - Parte 2


1. Finalmente qué operador voy a utilizar para realizar esta etapa de
2. entrenamiento y etapa de prueba entonces una opción es este el split validation
3. dice este operador divide aleatoriamente el conjunto de datos en un conjunto de
4. entrenamiento y un conjunto de prueba además de que evalúa el modelo este
5. operador yo lo tengo disponible en rapid mainer se llama split validation y es el
6. que vamos a utilizar para generar nuestras etapas de entrenamiento y de
7. prueba ese es un operador anidado tiene dos sub procesos el de entrenamiento y
8. el de prueba entonces cuando yo dé de alta a este operador la al darle doble
9. clic en el operador me va a abrir dos ventanitas una es la ventana de
10. entrenamiento y la otra es la ventana de prueba por eso se le llama operador
11. anidado dice el sub proceso de entrenamiento se utiliza para aprender o
12. construir el modelo y el modelo entrenado se aplica luego en el otro
13. subproceso en el de prueba dice el rendimiento del modelo también se mide
14. durante esta fase de prueba entonces aquí mismo en esta fase de prueba cuando
15. le dé doble click en clic validation me va a abrir dos áreas
16. que es la de entrenamiento y que es la de prueba en la parte de prueba yo ahí
17. mismo voy a evaluar el modelo que recibe como entrada dice la tabla de datos y
18. que recibe como salida el modelo la tabla de datos y el desempeño del modelo
19. esto es la evaluación que se le haga el modelo entonces esta es una forma de
20. utilizarla cuando veamos este operador el split validation por default te pone
21. un 70 por ciento de los datos para entrenamiento y un 30% para prueba pero
22. en sus parámetros tú los puedes modificar entonces este es el operador
23. que utilizaríamos otro operador es el cross validation este es similar al
24. speed validation cuál es la diferencia bueno esta es la segunda estrategia que
25. vimos esta es la que divide en cada conjuntos de datos entonces dice cross
26. validation divide la tabla de datos en k conjuntos de datos y entrena los datos
27. con las caminos un conjunto y prueba el modelo con el último conjunto entonces
28. yo puedo configurar acá qué se le llama falls en rapid main yo
29. puedo decir que tenga 10 15 o 20 vamos a suponer son 1000 datos como decíamos el
30. ejemplo yo tengo un fault o una caigua la 10 entonces va a dividir la tabla de
31. entrada en 10 subconjuntos y con 9 porque son caminos 1 conjuntos va a ser
32. la parte de entrenamiento y con el último que no utilizo va a ser la etapa
33. de prueba dice también es un operador anidado va a generar dos subconjuntos
34. que es el de entrenamiento y el de prueba el de entrenamiento se utiliza
35. para construir el modelo y el de prueba para aplicarlo entonces también recibe
36. como entrada toda la tabla de datos y va a generar como salida el modelo entonces
37. este es otro operador que es el cross validation cuando tenemos una gran
38. cantidad de datos se sugiere utilizar el cross validation en lugar del split
39. validation estamos hablando de registros de 5.000 6000 o más mucho más datos y lo
40. mejor sería utilizar un color validation ok estamos diciendo que los dos
41. operadores anteriores el split validation y el cross
42. validation son anidados y que tienen una etapa de entrenamiento y una etapa de
43. prueba dijimos que en esa etapa de prueba tu puedes ver el performance de
44. tu conjunto del modelo que se generó bueno entonces dentro de esa parte tú
45. tienes que aplicar el modelo para generar el árbol y esto lo vemos con la
46. play model este operador tú lo vas a utilizar para aplicar el modelo a los
47. datos que tú dejaste para pruebas acuérdate que si utilizas el split
48. validation lo más seguro es que te quede un 30 por ciento de los datos o si
49. utilizas del cross validation te quedó libre un conjunto de datos entonces con
50. ese dato que quedó libre con ese dato tú vas a poder aplicar el modelo entonces
51. dice este operador prueba el modelo del conjunto de datos de prueba el objetivo
52. es obtener una predicción sobre datos nuevos y si el conjunto de registros
53. sobre sobre los que se aplica el modelo debe ser compatible con los atributos
54. del modelo original entonces vas a tener una entrada que es el modelo
55. de datos de prueba y una salida que son los datos etiquetados entonces aquí
56. entra tu modelo entra en los datos que tienes para probarlo y que te va a
57. generar te va a generar el modelo entonces eso es lo que hace este
58. operador que es la playa modelo aquí te dejo las referencias
59. por si quieres profundizar en este tema

Se muestran los conceptos acerca de la evaluación del modelo de


árboles de clasificación. Se explica la matriz de confusión y las métricas
de medición. También, se muestra el funcionamiento del operador
correspondiente del software RapidMiner.

1. En este vídeo vamos a revisar cómo se lleva a cabo la evaluación de un modelo


2. que se haya generado para la evaluación del modelo y se debemos cuantificar el
3. grado o valor de bonanza de la solución encontrada entonces yo voy a generar un
4. modelo que puede ser un árbol por ejemplo de clasificación entonces debo
5. cuantificar es decir debo dar un dato de qué tan exacto es ese modelo que yo
6. genere para qué bueno pues esto permite comparar entre distintos métodos sobre
7. los mismos conjuntos de datos entonces yo puedo tener un conjunto de
8. datos y aplicar un modelo de predicción por ejemplo como los árboles de
9. clasificación y ver qué tanta exactitud tuvo mi modelo pero igualmente puedo
10. utilizar el modelo de predicción por ejemplo de ney beige y compararlos y ver
11. qué modelo es más exacto entonces por eso es importante evaluar el modelo que
12. yo estoy generando ahora bien esta evaluación del modelo por ejemplo el de
13. clasificación se calcula comparando las predicciones generadas por el modelo en
14. un conjunto de datos por ejemplo de con las etiquetas de clase
15. de las instancias de este conjunto de datos yo puedo generar un modelo que me
16. va a predecir si un pasajero sobrevivió o no sobrevivió en el titanic entonces
17. generó mi modelo y digo no pues todas las mujeres que viajan en clase superior
18. clase alta y que son de tal edad van a sobrevivir eso es lo que dice mi modelo
19. entonces cuando lo aplicó a nuevos datos pudiera ser que se encuentra un registro
20. es decir una pasajera con esas características y vemos que realmente
21. esa persona no sobrevivió sin embargo mi modelo dice que si sobrevivió y así lo
22. registra el modelo dice esta persona que se en registro número 315 si va a
23. sobrevivir pero si me voy a los datos etiquetados o sea los datos reales me
24. doy cuenta que este no sobrevivió entonces eso pues pasa en los modelos
25. que yo genero porque pues porque no puedo generar un modelo que se aplique a
26. todo el conjunto de datos es muy difícil generar eso entonces generalmente tiene
27. un porcentaje de exactitud a eso se refiere evaluar el modelo
28. tan exacto es mi modelo para predecir cómo evaluó el modelo bien lo voy a
29. evaluar con esta matriz que se le llaman matriz de confusión o matriz de
30. contingencia esta matriz de confusión es una tabla y se con la visión gráfica de
31. los errores cometidos por el modelo de clasificación otra definición dice es un
32. modelo gráfico para visualizar el nivel de acierto de un modelo de predicción a
33. esta matriz de confusión también se le llama tabla de contingencia o matriz de
34. errores entonces esta es la matriz en términos generales lo que yo tenemos
35. tenemos aquí dice clase predicha y clase verdadera a qué se refiere esto la clase
36. verdadera es como están realmente los datos y yo tengo una p y una n quiere
37. decir que son positivos y negativos entonces tengo en la clase verdadera o
38. sea cómo realmente pasaron los datos tengo los positivos en esta fila podemos
39. suponer los que sí sobrevivieron realmente
40. que no sobrevivieron los tengo en esta fila que es el n y acá tengo las
41. predicciones que es la clase predicha es decir esto es lo que te dice tu árbol de
42. clasificación si entonces yo tengo aquí los positivos o sea los que es mi árbol
43. predice que si sobreviven es esta columna que yo tengo aquí y los que mi
44. árbol predice que no sobreviven que es esta columna que yo tengo aquí entonces
45. que hay en estas casillas que son las intersecciones bien pues aquí está una
46. comparación entre lo que realmente pasó que es la clase verdadera con lo que
47. está en la predicción que es esta columna que yo tengo aquí que es la
48. clase predicha entonces los que yo tengo aquí dice son pp que son los true p que
49. positivos entonces qué quiere decir verdaderos positivos o reales positivos
50. y en esta que yo tengo aquí tengo los que realmente no sobrevivieron
51. pero que se predijo que si van a sobrevivir entonces son los falsos
52. positivos porque falsos positivos pues porque la predicción me dice que es
53. positivo pero realmente son negativos que es lo que yo tengo en esta casilla
54. tengo los que la predicción dije que no pero que realmente si sobrevivieron
55. entonces a esto se les llama falsos negativos y acá que es lo que tengo
56. tengo los que se predijo que no iban a sobrevivir y realmente no son son que no
57. sobrevivieron entonces son verdaderos negativos vamos a explicar con más
58. detalle esta matriz entonces aquí tengo la misma matriz que yo les comenté y
59. aquí tengo las etiquetas de cada uno de ellos
60. entonces los verdaderos positivos que es true positivo que es lo pp estos que yo
61. tengo aquí me dice es el número de registros o clasificaciones correctas
62. en la clase positiva p las correctas es decir la clase verdadera la clase
63. real estos son los positivos los que
64. realmente son positivos y los que se predijeron como positivos entonces pp
65. son los que realmente son positivos verdaderos luego tengo el verdadero
66. negativo que esté n esté que yo tengo aquí número de clasificaciones correctas
67. en la clase negativa es decir yo predije que eran nos y realmente fueron nos
68. entonces es el verdadero negativo luego tengo los falsos negativos o fn estos
69. que yo tengo aquí y estos a qué se refiere son clasificaciones incorrectas
70. de clase positiva clasificadas como negativa entonces el modelo predijo que
71. era negativo pero realmente son positivos entonces es
72. efe y finalmente tengo estos que están aquí
73. que son los 'falsos positivos' dice el número de clasificaciones incorrectas de
74. clase negativa clasificada como positiva se hizo una predicción de que era
75. positivo pero realmente son negativos esto es lo que contiene una matriz de
76. confusión aquí yo quiero hacer una observación la teoría en esta
77. bibliografía tiene la clase verdadera en las filas y tienen las columnas la
78. predicción una acotación muy importante aquí que les quiero hacer es que rapid
79. mainer trabaja la matriz de confusión en forma inversa entonces la predicción
80. rápida mainer la pone en las filas y en las columnas pone lo que realmente pasó
81. ya les explicaré en los vídeos de las prácticas que hagamos pero básicamente
82. es lo mismo el mismo funcionamiento de la matriz de confusión sólo que están
83. acomodadas en forma inversa lo que te predijo el modelo y lo que realmente
84. está sucediendo
85.

Evaluación del modelo - Parte 2

1. Bien entonces ya que entendimos los elementos de la matriz de confusión


2. vamos a explicar las métricas es decir qué son las métricas son datos que nos
3. proporcionan información general sobre el número de instancias incorrectamente
4. clasificadas entonces yo tengo un primer valor que es el error de clasificación a
5. que es igual este error de clasificación dice es la suma de las predicciones
6. incorrectas sobre el número total de predicciones entonces cuáles son las
7. predicciones incorrectas son las predicciones falsas qué quiere decir
8. esto me voy a regresar afp y efe n que es fp es el número de
9. clasificaciones incorrectas de la clase negativa y fn número de clasificaciones
10. incorrectas de la clase positiva entonces son los falsos positivos y los
11. falsos negativos es decir el modelo predijo positivos pero realmente son
12. negativos y en este caso el modelo predicó negativos pero realmente son
13. positivos entonces el total de errores son fp +
14. efe ns son el total de errores entre el número total de predicciones que son los
15. cuatro elementos los falsos positivos más los falsos negativos más los
16. verdaderos positivos más los verdaderos negativos entonces esta operación me va
17. a dar como resultado el error de clasificación y ahora bien la exactitud
18. es el número de predicciones correctas sobre el número total de predicciones
19. entonces en las predicciones correctas son el cruce que es el verdadero
20. positivo más los verdaderos negativos es decir el modelo predijo positivos y
21. realmente eran positivos el modelo predijo negativos y realmente
22. eran negativos entonces sumo en todos los que las predicciones fueron
23. correctas que este p + tn y los voy a dividir entre el total
24. que son los falsos positivos más los falsos negativos más los verdaderos
25. positivos más los verdaderos negativos igual lo puedo calcular yo si ya calculé
26. el error de clasificación entonces a uno le restó este valor y me tiene que dar
27. la exactitud o bien la cálculo con esta fórmula entonces aquí tengo yo dos
28. métricas que es el error de clasificación y la exactitud del modelo
29. finalmente cómo puedo yo generar en rapid mainer esta matriz de confusión es
30. mediante el operador performance mediante este operador voy a evaluar el
31. desempeño del modelo calcula la exactitud y el error del modelo es decir
32. estos dos datos el error y la exactitud los voy a calcular con el operador como
33. se llama el operador performance entonces con este operador que ahí lo
34. vamos a insertar recibe como entrada el modelo y el conjunto de datos de prueba
35. van a entrar aquí y que me va a generar pues los datos ejecutados y el
36. performance es decir la matriz de confusión entonces con este operador
37. yo voy a generar esta matriz de confusión entonces hasta aquí pues bueno
38. hemos visto cómo se evalúa modelo y aquí les dejo las referencias
39. para que profundicen en este tema

se muestra una descripción del software RapidMiner, se mencionan sus


características y los sectores en los que se utiliza. También, se describe en
términos generales cómo se puede utilizar para la creación del modelo de árboles
de clasificación.

1. El software especializado RapidMiner es una plataforma de ciencia de datos


2. que te permite aplicar modelos mediante los cuales las empresas pueden generar
3. ingresos reducir costos y evitar riesgos actualmente es utilizada en más de
4. 30.000 empresas globales en los sectores de ventas al detalle comercio
5. electrónico servicios financieros salud y manufactura entre muchos otros
6. RapidMiner es líder en el cuadrante mágico de gartner 2019 para plataformas
7. de ciencia de datos y aprendizaje automático por sexto año consecutivo
8. esto entre otros premios y posiciones importantes que ocupado en diversos
9. estudios internacionales mediante el software rapid mainer se pueden crear
10. modelos basados en tablas de datos insertar operadores y establecer
11. conexiones para definir el flujo de datos del modelo el uso del software
12. especializado RapidMiner es muy sencillo ya que funciona mediante la
13. técnica de arrastrar y soltar el código que ya está empaquetado en una gran
14. cantidad de operadores el usuario debe arrastrar los operadores y conectarlos
15. para la creación de los modelos lo más importante es la interpretación y esto
16. lo debe hacer el usuario los modelos y técnicas de analítica predictiva como el
17. árbol de decisión se pueden implementar en forma fácil con el apoyo de este
18. software especializado se requiere una base de datos suficientemente grande
19. para su adecuada implementación en este tema
20. verás paso a paso la aplicación de la técnica de minería de datos del tipo
21. predictivo como los árboles de decisión para generar un modelo de predicción que
22. apoye a la toma de decisiones en las empresas cuando se realiza una práctica
23. de creación de un modelo de predicción con los árboles de decisión es
24. importante interpretar en forma correcta los datos para esto se deben identificar
25. las reglas que se generan del árbol y los casos críticos para estar en
26. condiciones de tomar decisiones en forma acertada se debe evaluar el módulo y los
27. resultados deben ser interpretados en forma correcta
28.

● Los árboles de decisión son modelos de predicción muy comunes y


estudiados. Además, son fáciles de construir y de interpretar.
● Un tipo de árboles de decisión, son los árboles de clasificación, que
clasifican los datos del conjunto de entrada, tomando como base una
variable clasificadora categórica, es decir, que toma un conjunto finito
de valores. Esto es, por ejemplo, que puede valer solamente SI o NO.
● Un árbol de clasificación es una secuencia de condiciones que son
interrogadas con respecto a los datos de entrada, tomando una decisión
parcial que lleva hacia una rama u otra, repitiendo este proceso hasta
llegar a una hoja donde se toma una decisión final.
● Las aplicaciones de los árboles de clasificación son muy variadas, por
ejemplo, se utilizan en la predicciones de siniestros, de abandono de
clientes, de logro de metas de producción o bajas de alumnos en el
sector educativo.
● El modelo de árboles de clasificación es un modelo supervisado que se
puede implementar mediante el software especializado RapidMiner.
● El modelo debe contener sus etapas de Entrenamiento y Prueba. La
evaluación del modelo se realiza mediante la matriz de confusión.

Clasificador bayesiano
En esta unidad, se muestra una introducción al clasificador bayesiano

Naive Bayes, donde se describen sus conceptos y usos.


También, se describen las etapas que se deben seguir para implementar

un modelo de predicción basado en Naive Bayes. Asimismo, se explica el

problema de sobreentrenamiento que puede llegar a tener el modelo.

Se describen las características técnicas del algoritmo Naive Bayes, se


explica el Teorema de Bayes, además de mostrar la forma de calcular las
tablas de frecuencias y probabilidades, después, se presentan los cálculos
para la probabilidad posterior de las clases SI y NO y finalmente se
muestra el resultado de la predicción.

También podría gustarte