Machine Learning 2

¿Pero por qué es necesario aprender sobre Machine Learning hoy en día?
Los algoritmos de
Machine Learning los utilizamos diariamente y en ocasiones es tan normal su uso que no nos
damos cuenta que lo que estamos utilizando se encuentra programado con algoritmos de Machine
Learning. Veamos varios ejemplos de esto:
 Los correos electrónicos es uno de los primeros ejemplos que nos dan al momento de
aprender sobre Machine Learning y se puede decir que fue uno de los algoritmos que se
empezaron a utilizar de manera masiva y que en su momento y hasta el día de hoy lo
hemos agradecido infinitamente. El simple hecho que se pueda detectar si un correo
recibido es algo que nos interesa o simplemente un correo no deseado hace que nos
ahorremos mucho tiempo en el día a día. Esta clasificación se hace por medio del
aprendizaje del algoritmo, tomando en cuenta parámetros ya establecidos, por ejemplo si el
asunto o el contenido del correo contiene palabras definidas por el proveedor del correo
como prohibidas. Pero también aprende del usuario, con el simple hecho de seleccionar un
correo y clasificarlo como no deseado el algoritmo aprende y cuando se vuelva a recibir un
correo de este usuario se irá directamente a la bandeja de spam o correo no deseado. Este
fue una de las aplicaciones de Machine Learning que en su momento tuvo un gran impacto
para los que usabamos los correos eléctronicos simplificando las tareas.
 Otra de las aplicaciones que usamos día a día es el reconocimiento facial en las fotos que
publicamos en Facebook. Este es uno de los algoritmos que ha perfeccionado en los
últimos años Facebook y es considerado uno de los mejores en está área. Con el simple
hecho de publicar una foto en la plataforma el modelo realiza un escaneo de la misma y
comparando con los datos que tiene almacenado puede relacionar los nombres de cada
una de las personas que se encuentran en la foto. Este algoritmo se ha venido
perfeccionado con el pasar el tiempo, cuando comenzo a implementarse podiamos
observar que en ocasiones se equivocaba para determinar quien era quien pero al día de
hoy ocurre cada vez menos por lo que el algoritmo ha ido mejorando su aprendizaje.
 Las recomendaciones de las películas de Netflix conjugan una serie de algoritmos que
unidos realiza las recomendaciones de las películas y series. Acá el algoritmo aprende
tanto de las películas vistas, las películas que dejamos de ver, las que incluimos en nuestra
lista de visualización, así como también si utilizamos un celular, una tableta o una pantalla,
y muchas más información que se utiliza para realizar las mejores recomendaciones para
cada uno de los usuarios.
 Otra de las aplicaciones en las que usamos Machine Learning es en la traducción
simultánea. ¿Cuándo hubiésemos imaginado que con solo poner la pantalla de nuestro
celular sobre una imagen con letras en otros idiomas, como chino o ruso, este nos iba a
traducir automáticamente y de manera muy eficiente lo que se decía allí a nuestro idioma?
Hace unos años atrás esto era inimaginable pero ahora estan sencillo como tomar una foto.
Esto se logro gracias a una de las tantas ramas que tiene Machine Learning.
 Otras de la aplicaciones que tiene y que en ocasiones nos molesta y creemos que nos
están espiando por algún lado son las publicaciones de publicidad tanto de Facebook como
de Google .No es magia o que nos espían es que simplemente estas dos grandes
compañías manejan tanta información sobre nosotros que fácilmente la pueden utilizar para
vendernos productos o paquetes que en ocasiones ni nosotros mismo sabiamos que
queriamos, pero todo esto se logra por la cantidad de datos que ellos manejan y que ahora
lo utilizan las empresas de publicidad y mercadeo.
En fin, estos son solo unos pocos ejemplos en donde podemos poner en práctica los algoritmos
de Machine Learning, acá lo importante es que sepas que nunca es tarde para aprender sobre
este tema porque cada año o más bien cada mes vamos a poder ver nuevas aplicaciones en
este ambito por lo que es importante por lo menos conocer de que se trata.
Ahora bien, el curso está dividido de la siguiente forma: Comenzaremos con la historia de
Machine Learning. Ya conociendo la historia y algunos de sus usos podemos definir qué es
exactamente Machine Learning. Continuaremos con su clasificación y posteriormente
hablaremos sobre algunos algoritmos de aprendizaje supervisado y aprendizaje no
supervisado. Cada uno de estos algoritmos tienden las bases para algoritmos mucho más
profundo sobre Machine Learning, por lo que es importante conocer estos antes de profundizar
sobre los mismos.
hoy te hablare sobre la historia de Machine Learning De repente te parecerá un poco aburrido y que
no es necesario conocer la historia pero conociendo esta podrás ver la evolución que ha tenido
Machine Learning con el pasarde los años y a su vez observarás el progreso que ha tenido
últimamente. Pero sin más que decir comencemo.
La historia de Machine Learning comienza en 1950 con Alan Turing cuando publica un articulo
titulado Computación e Inteligencia, en donde plantea lo que ahora conocemos como la Prueba de
Turing. Esta es una prueba de habilidad de una máquina de mostrar un comportamiento inteligente
similar al de un humano. La misma no evalúa el conocimiento de la máquina en cuanto a su
capacidad de responder preguntas correctamente, solo se toma en cuenta la capacidadde ésta de
generar respuestas similares a las que daría un humano. Turing propuso que un humano evaluará
conversaciones en lenguaje natural entre otro humano y una máquina diseñada para generar
respuestas similares a las de un humano. Entre las premisas definidas para realizar esta prueba se
encontraba de que el evaluador sabría que uno de los miembros de la conversación sería una
máquina. A su vez la conversación estaría limitada a un medio textual únicamente, de esta forma no
sería necesario que la máquina transformará el texto en habla. En el caso de que el evaluador no
pueda distinguir entre el humano y la máquina, acertadamente, la máquina habría pasado la
prueba.
Para el año de 1952 Arthur Samuel escribe el primer programa de ordenador capaz de aprender.El
software era simplemente un programa que jugaba a las damas y que podía aprender de sus
errores partida tras partida mejorando de esta forma sus habilidades.
Para el año de 1957 Fran Rosenblatt diseña el Perceptron, una red neuronal en hardware para
reconocimiento de caracteres. El propósito era el de explicar y modelar las habilidades de
reconocimiento de patrones de los sistemas visuales biológicos.
En 1979 los estudiantes de la Universidad de Stanford, diseñan un carro capaz de moverse

autónomamente por una habitación evitando obstáculos. El carro pudo cruzar con éxito toda una
habitación llena de sillas y obstáculos sin intervención humano en aproximadamente 5 horas.
Para el año 1981 Gerald DeJong crea el concepto de Aprendizaje Basado en Experiencia, haciendo
que un computador analice información de entrenamiento y cree una regla general que le permita
descartar información no importante.
Ya en 1985 Terry Sejnowski inventa NetTalk, un software que aprende a pronunciar palabras de la
misma manera que lo haría un niño. Durante los primeros años de los 90s, científicos empiezan a
crear programas que analicen grandes cantidades de datos y saquen conclusiones, o aprendan, de
los resultados.
En 1996 el computador Deep Blue de IBM vence una partida de ajedrez a Gary Kaspárov, campeón
del mundo vigente, aunque al final Kaspárov ganó 3 partidas más, derratando a Deep Blue.Para
mayo de 1997 se vuelven a enfrentar pero esta vez con una nueva versión de computador llamado
Deeper Blue, esta vez se jugaron 6 partidas siendo el vencedor el computador.
Para el año del 2006 Geoffrey Hinton presenta el concepto de Deep Learning o
AprendizajeProfundo. Con este concepto se explicaron los nuevos algoritmos que permiten que los
computadores distingan diversos objetos y textos tanto en imágenes como en videos.
En el 2010 el Kinect de Microsoft es capaz de reconocer 20 características del cuerpo humano a

una velocidad de 30 veces por segundo.
Para el 2011 el ordenador Watson de IBM vence a dos inteligentes concursantes en la tercera
ronda del concurso estadounidense de preguntas y respuestas Jeopardy.
En el 2011 se crea GoogleBrain por Jeff Dean de Google y Andrew Ng profesor de la Universidad
de Stanford. El propósito de este proyecto fue de crear una red neuronal utilizando toda la
capacidad de la infraestructura de Google para detectar patrones en vídeos e imágenes.
En el 2012 los laboratorios Google X, ahora llamado solamente X o X, desarrollan un algoritmo de

aprendizaje automático que puede navegar de forma autónoma por los videos de Youtube para
identificar los videos que contienen gatos.
¿Se acuerdan de la prueba de Turing que les hable en un principio y que fue planteada en 1950?
Bueno, fue hasta el 2014 que se pudo ejecutar de manera exitosa. Un programa de ordenador ha
logrado convencer a más del 30% de los jueces que era genuinamente un humano .Se trata de un
chartbot (robot programado para charlas online) que obedece al nombre de Eugene Goostman, el
programa fue capaz de convencer al 33% de los jueces que participaron en laprueba de que
estaban chateando con un niño ucraniano de 13 años.
Para el 2014 Facebook desarrolla DeepFace, un algoritmo de software que puede reconocer
individuos en fotos al mismo nivel que los humanos.
Y empezamos en el año en donde se puede observar el más grande avance en Machine Learning
que fue el año de 2015. En este año Amazon lanza su propia plataforma de aprendizaje automático
o Machine Learning.A su vez, Microsoft crea el kit de herramientas para el aprendizaje de máquinas
distribuidas,que permite la distribución eficiente de problemas de aprendizaje automático en
múltiplescomputadoras.En este mismo año Google entrena un agente conversacional de
inteligencia artificial,que no solo puede interactuar convincentemente con humanos como un
servicio de soporte técnico,sino también discutir la moralidad, expresar opiniones y responder
preguntas generalesbasadas en hechos.A su vez, OpenAI es creada. Esta es una compañía de
investigación de inteligencia artificialsin fines de lucro que tiene como objetivo promover y
desarrollar inteligencia artificialamigable de tal manera que beneficie a la humanidad en su
conjunto. Entre sus fundadoresse encuentra Elon Musk, el mismo de Tesla y Spacex.Debido a los
grandes avances obtenidos en el área de Machine Learning e inteligenciaartificial, más de 3000
investigadores de estas áreas, respaldados por Stephen Hawking,Elon Musk y Steve Wozniak,
firman una carta abierta advirtiendo del peligro de las armasautónomas que seleccionan y atacan
objetivos sin intervención humana, esto con el propósitode llamar la atención a los gobiernos que
están desarrollando este tipo de tecnologías.Ya para el 2016 el algoritmo de inteligencia artificial de
Google vence a un jugador profesionalen el juego de mesa chino Go, que es considerado el juego
de mesa más complejo del mundo y mucho más difícil que el ajedrez. El algoritmo desarrollado por
Google DeepMindlogró ganar cinco juegos de cinco en la competencia de Go.Y finalmente llegamos
al año de 2017 en donde OpenAI entrena chat bots o agentes conversacionales,que inventan su
propio lenguaje para cooperar y lograr su objetivo de manera efectiva. Pocodespués, Facebook
también capacitó exitosamente a agentes para negociar e incluso mentir.Meses después un
algoritmo desarrollado también por OpenAI derrota a los mejores jugadoresen partidos 1 contra 1
del juego en línea Dota 2.Si observamos la línea de tiempo podemos ver que los avances en
Machine Learning hancrecido de manera exponencial en los últimos años esto se debe en gran
medida en que lacantidad de datos se ha incrementado pero a su vez la tecnología ha mejorado
haciendoposible crear nuevos algoritmos más eficientes y con mejores resultados.Ahora bien les
hago una pregunta ustedes creen ¿qué nos estamos acercando a la inteligenciaartificial? ¿Qué nos
estamos acercando cada vez más a que las máquinas reemplacen porcompleto al ser humano? La
respuesta dada a esta pregunta por varioscientíficos la pueden encontrar en el blog, les dejo el
enlace en la cajita de descripciónde este video, los invito a pasarse por la web ya que podrán
encontrar más informaciónsobre este tema por allá.Con esto finalizamos con este video y
terminamos con el primer punto de nuestro Curso de Introduccióna Machine Learning. Si te gusto
este video te invito a darlelike y a suscribirte en el canal para que no pierdas ningún otro video que
estaré publicandocon contenido sobre Machine Learning. Muchas gracias por verme y nos vemos
en elpróximo video. Chao.
DEFINICIÓN DE MACHINE LEARNING

Te hablare sobre la definición de Machine Learning. Ya hemos hablado de la historia e inclusive de
algunos de los usos que tiene hoy en día. Pero hoy te hablaré sobre su definición para ser más
exacta. Pero primero veamos como lo definen varios especialistas y expertos en esta área.
Comencemos con Andrew Ng uno de los expertos en Machine Learning y Deep Learning y quien
tiene desarrollado varios cursos sobre esta área. Él define Machine Learing como la ciencia de
hacer que las computadoras actúen sin estar explícitamente programadas. Por otra parte, los
expertos de Nvidia, una de las empresas que desarrolla gran parte de la tecnología para
implementar los algoritmos de Machine Learning, lo define como la práctica de usar algoritmos para
analizar datos, aprender de ellos y luego hacer una determinación o predicción sobre algo en el
mundo. A su vez McKinsey y Compañía una de las consultoras más grande en esta área, indica
que, el aprendizaje automático o Machine Learning se basa en algoritmos que pueden aprender de
los datos sin depender de la programación basada en reglas. Y finalmente Tom Mitchell profesor del
departamento de Machine Learning de la universidad Carnegie Mellon indica que, el campo de
aprendizaje automático o Machine Learning busca responder a la pregunta ¿cómo podemos
construir sistemas informáticos que mejoren automáticamente con la experiencia, y cuáles son las
leyes fundamentales que rigen todos los procesos de aprendizaje? Si observamos las 4 definiciones
vemos que todas tienen sus similitudes y que en cierta forma se complementan unas con otras. Si
buscamos una sola definición podemos decir: El Aprendizaje Automático o Machine Learning, es
utilizar algoritmos que puedan decir algo interesante en base a un conjunto de datos sin tener que
escribir ningún código específico para el problema. Esta definición conjuga todas las anteriores.
Ahora bien, si ponemos en práctica esta definición podemos decir que nos llegó un correo
electrónico, el mismo entra a una nube que no sabemos exactamente cómo funciona, pero sabemos
que es un algoritmo de aprendizaje automático o Machine Learning. Pero al mismo tiempo, se
alimenta de una base de datos y a su vez de lecciones aprendidas. Para al final determinar si ese
correo que recibimos es un correo deseado o no deseado. Ahora veamos esto mismo, pero
poniendo como ejemplo el sistema de recomendación de películas de Netflix. Acá tenemos una
nueva película que entra al catálogo de Netflix. La misma entra a una nube que no sabemos cómo
funciona exactamente, pero sí sabemos que cuenta con la información de las películas que hemos
visto durante todo el tiempo que hemos estado suscrito a la plataforma y a su vez conoce las
películas que le hemos dado me gusta o por el contrario manito hacia abajo indicando que no nos
gusta. Y con toda esta información este algoritmo de Machine Learning puede determinar si esta
nueva película nos va a gustar o por el contrario es preferible que no nos la recomiende porque
seguramente no será de nuestro agrado. Todo esto es a groso modo lo que significa Machine
Learning y cómo funciona de manera práctica, obviamente muy por encima. Con esto cubrimos el
punto de la Definición de Machine Learning.
CLASIFICACIÓN DE MACHINE LEARNING

Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine Learning. En el
video de hoy te hablare sobre la clasificación de Machine LearningEsta clasificación es de las más
tradicionales que se hace en esta área.Comenzamos con el Aprendizaje Supervizado o Supervised
Learning, esta se produce cuandoun algoritmo aprende a partir de datos de ejemplos y respuestas
de destino asociadasque pueden consistir en valores numéricos o etiquetas de cadena, como
clases, para luegopredecir la respuesta correcta cuando se presenta con nuevos ejemplos. El
enfoque supervisadoes de hecho similar al aprendizaje humano bajo la supervisión de un maestro,
el maestroproporciona buenos ejemplos para que el alumno los memorice, y luego el alumno
obtiene reglasgenerales de estos ejemplos específicos.Veamoslo con un ejemplo tenemos esta data
etiquetada, en la primera tenemos una imageny en la segunda tenemos la respuesta a esa imagen
que sería un gato.Esta información la introducimos a nuestro algoritmo de aprendizaje supervisado.
Esteaprende y crea el modelo que cada vez que vea esta imagen tendrá como predicción
ungato.Por lo tanto como ya nuestro algoritmo ha aprendido, entonces podemos introducir
unaimagen pero esta vez sin indicarle cuál es su significado ni que reprensenta pero comoya lo
aprendio puede predecir automáticamente que es un gato.Asi es como funciona, muy por encima,
los algoritmos de Aprendizaje Supervisado.Veamos ahora la siguiente clasificación que corresponde
a Aprendizaje No Supervisado oUnsupervised Learning. Este ocurre cuando un algoritmo aprende
de ejemplos simples sinninguna respuesta asociada, dejando que el algoritmo determine los
patrones de datospor sí mismo. Este tipo de algoritmo tiende a reestructurar los datos en otra cosa,
comonuevas características que pueden representar una clase o una nueva serie de valores
nocorrelacionados. Son bastante útiles para proporcionar a los seres humanos informaciónsobre el
significado de los datos y nuevas aportaciones útiles a los algoritmos de aprendizajeautomático
supervisados.Veamoslo de manera práctica, tenemos este conjunto de datos, como podemos
observar sonuna serie de imágenes de varios animales. En este tipo de aprendizaje no se le
introduceque significa cada una de las imágenes, como lo hicimos con el anterior, y esta es unade
las grandes diferencias que tiene este aprendizaje con el Aprendizaje Supervisado.Esta información
la introducimos en nuestros algoritmos de Aprendizaje No Supervisado,y lo que hace estos
algoritmos es estudiar la data y agruparla en similitudes de acuerdoa las características, en este
caso agrupa a los animales de acuerdo a sus características.Ahora bien ya con nuestro algoritmo
aprendido con esta información, podemos ingresarleuna nueva imagen, el resultado o predicción es
agruparla al conjunto de datos que tengaslas características más parecidas a ella, por lo que
agrega a este conjunto.Acá la predicción no es decir que tipo de animal es sino agrupar a los
animales de acuerdoa sus especificaciones.La siguiente clasificación es la de Aprendizaje
Reforzado o Reinforced Learning. En este aprendizajeno hay una clave de repuesta, pero el
algoritmo aún tiene que decidir cómo actuar para realizarsu tarea. En ausencia de datos de
capacitación, el algoritmo aprende de la experiencia, recogelos ejemplos de entrenamiento (esta
acción fue buena – esta acción fue mala) a travésde ensayo y error mientras intenta su tarea, con el
objetivo de maximizar la recompensaa largo plazo. Un ejmplo de esto lo vemos al introducir
unaimagen de una mariposa al algoritmo. Este no conoce qué es por lo que “adivina”indicando que
es un gato. Obviamente la respuesta es incorrecta por lo que se le indica al algoritmoy a su vez se
le puede dar la respuesta correcta, en ocasiones el algoritmo tiene que seguirdando respuestas
hasta que obtenga la correcta. Una vez dada esta información al algoritmo,la aprende para una
nueva oportunidad. Si ahora a este algoritmo, ya aprendido, sele introduce nuevamente una foto de
una mariposa, la respuesta que dará será la correcta yaque ha aprendido.Veamos ahora la
siguiente clasificación que corresponde a Aprendizaje por Procesamientode Lenguaje Natural o
Natural Language Processing. Este es una de las clasificaciones que enocasiones se le atribuye a
la Inteligencia Artificial, aunque al final son mejoras aalgoritmos propios de Machine Learning para
cumplir un propósito bien claro. Este aprendizajeformula mecanismos eficaces para la comunicación
entre personas y máquinas por medio de lenguajesnaturales.Por ejemplo se le puede introducir al
algoritmo la palabra “gracias” en distintos idiomasy el algoritmo podrá determinar los idiomas y el
significado de cada una de las palabras.Este algoritmo es utilizado en un sin fin de aplicaciones hoy
en día, como el análisisde discursos, documentos, entre otros sin importar el idioma en que se
encuentre.Y finalmente llegamos a la última clasificación que es la de Aprendizaje Profundo o Deep
Learning.Este es el aprendizaje que ha tenido más auge en los últimos años, por todo lo queha
podido conseguir. Utiliza los principios de los algoritmos básicos de Machine Learning,en conjunto,
intentando modelar abstracciones de alto nivel en datos usando arquitecturascompuestas. Esta
definición puede ser compleja, pero es que con este aprendizaje se puedehacer practicamente
cualquier cosa, la desventaja es que requiere un número superior de datos,comparado con los otros
algoritmos, pero el mayor inconveniente que tiene es que se requieretecnología de punta para
poder procesar los algoritmo, razón por la cual, no ha sido,hasta ahora que se ha venido
desarrollando este aprendizaje.Un ejemplo de lo que puede hacer este algoritmo es tomar una foto
en blanco y negro y colocarlecolor, determinando cada uno de los elementos que contiene para así
determinar qué colorse beneficia y cúal no.Existen muchas otras clasificaciones que en ocasiones
se le atribuye a la InteligenciaArtificial pero al final son mejoras a los algoritmos propios de Machine
Learning quese hace para cumplir con un propósito en específico.Seguramente con el pasar de los
años esta clasificación se irá ampliando sobretodocon las mejoras en las tecnologías para procesar
la información y los algoritmos, pero labase siempre será la misma, razón por la cual en este curso
de Introducción a MachineLearning nos enfocaremos en los algoritmos bases que son los que todos
debemos conocersi estamos comenzando. Estos algoritmos se encuentran dentro de la clasificación
deAprendizaje Supervisado y No Supervisado y en estos nos enfocaremos solamente.Estos serán
los algoritmos que vamos a ver, de repente te intimidan un poco, pero tenlopor seguro que después
que veas como funcionan cada uno de ellos se te hará muy fácil yaque muchos son parecidos y en
ocasiones se complementan entre si.Los nombres los coloco en inglés porque de esta forma es más
fácil identificarlos ybuscarlos por internet, sobretodo que la traducción en español en ocasiones
varias para cadauno de ellos, por lo tanto, es preferible que los vayas conociendo en inglés.Te dejo
la pregunta del video. ¿Qué otro método o algoritmo crees que se puede agregaren la clasificación
de Machine Learning acá descrita?Deja en los comentarios de este video cual te parece que es otra
clasificación que podemosincluir acá. Si por el contrario quieras saber la respuestapuedes pasar por
el blog, el link te lo dejo en la cajita de descripción, en donde encontrarásla respuesta a esta
pregunta. En caso de que tengas alguna duda tambiénpuedes dejarlo en los comentarios y con
gusto te responderé.Con esto cubrimos el punto de este video correspondiente a Clasificación de
Machine LearningLos invito a visitar la página web en dondeencontraran mas información sobre
este tema, les dejo el link en la cajita de descripción.También los invito a que continuen viendo este
curso de Introducción a Machine Learningpara que aprendan más sobre este interesante
tema.Muchas gracias por verme y nos vemos en el próximo video. Chao.
APRENDIZAJE SUPERVISADO: LINEAR REGRESSION

Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine Learning. En el
video de hoy te hablare sobre uno de los algoritmos más básico que tiene MachineLearning y es el
de Regresión Lineal o Lineal Regression.Este es el primer algoritmo que se ve dentro de la
clasificación de aprendizaje supervisadoy es de los más básico que encontrarás. Aunque en
ocasiones puede parecer algo aburridoen comparación con algunos de los algoritmos más
modernos, este algoritmo sigue siendoun método de aprendizaje útil y ampliamente utilizado.La
regresión es una forma estadística de establecer una relación entre una variabledependiente y un
conjunto de variables independientes. Y al final el objetivo es el de predecir lavariable dependiente
en función de los valores de las variables independientes.Pero, ¿qué son las variables
dependientes y las variables independientes?La variable independiente o característica es la que se
manipula para determinar el valorde una variable dependiente. Dicho de manera más sencilla, son
las características quequeremos usar para predecir algún valor dado de y.Por su parte, la variable
dependiente u objetivo es la que depende de los valores de la variableindependiente. En pocas
palabras, es la característica que estamos tratando de predecir. Esto tambiénse puede conocer
comúnmente como una variable de respuesta.Ahora bien podemos decir que la Regresión Lineal es
un método para predecir la variabledependiente (y) en función de los valores de las variables
independientes (X). Se puedeusar para los casos donde queremos predecir alguna cantidad
continua, por ejemplo, predecirel tráfico en una tienda minorista, predecir el tiempo de permanencia
de un usuario o elnúmero de páginas visitas en un blog, etc.Ahora bien pongamos un ejemplo,
tenemos los datos de los años de experiencia en un trabajo,esto vendría siendo nuestra variable
independiente o X y a su vez tenemos los salarios para cadauno de los años de experiencia, esto
sería nuestra variable dependiente o y.Con estos datos vamos a entrenar nuestro algoritmo de
Regresión Lineal para que genere un modeloque al introducir algún año de experiencia nos de
como resultado la predicción del salario.Si graficamos los datos entregados tendriamos una gráfica
parecida a esta. En donde observamosla relación entre los años de experiencia y el salario.Si
analizamos la gráfica nos damos cuenta que a medida que aumentan los años de
experienciaaumenta el salario. Ahora bien de acuerdo a los datos entregadosy aplicando el
algoritmo de Regresión Lineal, obtenemos el modelo para realizar la predicción.Este modelo
consiste en una línea recta que relaciona los datos. Esta no es una líneacualquiera, la misma se
contruye a través de ecuaciones matemáticas y los datos entregados.Pero la idea principal es
construir un modelo en este caso una línea que se lo másposible a los datos entregados. Ya con el
modelo obtenido podemos utilizarlopara realizar una predicción.En este caso queremos predecir el
salario a una persona que tiene 4 años de experiencia.Entonces tenemos nuestro algorito de
Regresión Lineal, el cual ha generado un modelo conlos datos entregados previamente.Ahora
queremos conocer el salario de una persona con 4 años de experiencia. Por lo que
introducimosesta información a nuestro modelo.Si utilizamos la gráfica podemos obtener el valor del
salario para ello llevamos lalínea del 4 hasta la recta que sería nuestro modelo y verificamos el
valor relacionadoubicado en el eje Y.En este caso el salario sería como 68 mil. De esta forma tan
sencilla podemos obteneresta información. Lo importante acá es determinar un buen modelo, ya
con esto podemos predecirlos datos.A pesar de ser un algoritmo sencillo las variables deben
cumplir ciertos criterios para ajustaruna línea de Regresión Lineal. En caso de que los datos no
satisfagan estos criterioslos resultados pueden ser incorrectos y engañosos.El primero de ellos es
que debe existir una relación lineal. La relación entre la entraday salida es lineal. No es compatible
con nada más. Esto puede ser obvio, pero es buenorecordar cuando tienes muchos atributos.La
Regresión Lineal asume que sus variables de entrada y salida no son ruidosas. Considerausar
operaciones de limpieza de datos que le permitan exponer mejor y aclarar la señalen los datos.El
modelo se ajustará demasiado a los datos cuando tenga variables de entrada
altamentecorrelacionadas.Y finalmente, la Regresión Lineal hará predicciones más confiables si sus
variables de entraday salida tienen una distribución normal.Ya vimos un ejemplo en donde la
variable independiente era una sola, ahora bien qué pasa si introducimosvarias variables
independiente como es este caso, en donde tenemos los datos de publicidadde televisión, radio y
periodicos, todas como variables independientes y con esta informaciónobtenemos las ventas,
siendo la variable dependiente.Teniendo esta información ¿podemos introducirla a un algoritmo de
Regresión Lineal y a suvez nos genere un modelo para predecirlas ventas?Pues si, porque la
Regresión Lineal se divide en dos, en simple y en múltiple.La Regresión Lineal Simple sería como
nuestro primer ejemplo, en donde teniamos una solavariable independiente, los años de
experiencia, y con esta única información predeciamosel salario.En cambio la Regresión Lineal
Múltiple examina la relación entre varias variables independientesy una variable dependiente. Este
sería nuestro último ejemplo, en donde teníamos la publicidaden varios medios de comunicación y
con esta información podiamos obtener las ventas.En resumen la Regresión Lineal es un método
para predecir la variable dependiente (y)en función de los valores de las variables independientes
(X).A su vez se clasifica en dos en Regresión Lineal Simple y Regresión Lineal Múltiple.Para ver si
entendieron este algoritmo te dejo esta pregunta, para que de acuerdo alo aprendido acá puedas
determinar la respuesta. Tienes tres opciones y deberás seleccionar¿cúal de los siguientes
ejemplos podemos aplicar el algoritmo de Regresión Lineal?En la opción uno tienes predecir el
precio de una acción de la bolsa de valores, utilizandolos valores históricos. La opción dos, predecir
si una persona estáenferma tomando en cuenta su altura, peso y temperatura.Y la opción tres,
predecir si una persona puede vivir o morir en el hundimiento delTitanic tomando en cuenta la edad,
sexo y la ubicación de su cabina.Recuerda que la respuesta correcta puede ser una o varias. Deja
en los comentarios de estevideo cual te parece que es la respuesta correcta. Si por el contrario
quieras saber la respuestapuedes pasar por el blog, el link te lo dejo en la cajita de información, en
donde entrarásla respuesta a esta pregunta. También encontrarás muchas más información sobre
este tema,por lo que te invito a visitarlo. En caso de que tengas alguna duda tambiénpuedes dejarlo
en los comentarios y con gusto te responderé.Con esto cubrimos el punto de este video
correspondiente a Regresión Lineal, esperoque te haya quedado claro. Los invito a visitar la página
web en dondeencontraran mas información sobre este tema, les dejo el link en la cajita de
descripición.También los invito a que continuen viendo este curso de Introducción a Machine
Learningpara que aprendan más sobre este interesante tema.Muchas gracias por verme y nos
vemos en el próximo video. Chao.
APRENDIZAJE SUPERVISADO: POLYNOMIAL REGRESSION
Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine Learning En el
video de hoy te hablare sobre el algoritmo de Regresión no Lineal.Este sería el segundo algoritmo
que vemos de aprendizaje supervisado y tiene simulitudesal anterior.Veamos el siguiente ejemplo,
en donde tenemos un conjunto de datos que gráficamente seobserva de esta manera.Ahora bien si
le aplicamos el algoritmo de Regresión Lineal el modelo queda de estaforma. Recordemos que este
algoritmo se trata en obtener una línea recta que mejor se ajustea los datos reduciendo el error
entre ambos. Como podemos observar la línea del modelose ajuste a los datos entregados.Ahora
bien observemos el siguiente ejemplo.Si le aplicamos el algoritmo de Regresión Lineal, quedaría
algo así. Como se observaexiste un gran error entre la línea y los datos, es decir el modelo no se
ajusta a losdatos por lo que no podemos utilizar este algoritmo para este conjunto de datos. A suvez
si nos recordamos a las premisas, que fueron explicadas en el anterior video, sabremosque uno de
los criterios que tenía que cumplir los datos es que fueran lineales y en estecaso no es así, por lo
que no podemos aplicar este algoritmo.Razón por la cual necesitamos aplicar el algoritmo de
Regresión no Lineal o Polinomeal.El cual haría un modelo como se muestra. Pero de qué se trata
este modelo.La Regresión Polinomial o no Lineal modela la relación entre la variable dependientey
las variables independientes como un polinomio de orden n.Pero, ¿qué son las variables
independientes y variables dependientes?La variable independiente o característica, son las
características que queremos usarpara predecir algún valor dado de y. Mientras que la variable
dependiente u objetivo,es la característica que estamos tratando de predecir.Viendo este algoritmo
por medio de un ejemplo, tenemos los datos de temperatura, que vendríasiendo nuestra variable
independiente y los datos de demanda de energía, nuestra variabledependiente.Esta información la
utilizamos para calcular nuestro modelo por medio de Regresión noLineal para predecir la demanda
de energía.Graficamente esta información se vería de esta forma. Como podemos observar los
datosno son lineales por lo que tenemos que utilizar el algoritmo no lineal.Si calculamos un modelo
con polinomio de grado 2 obtendriamos algo como esto, como podemosobservar este modelo no
cubre todos los datos.Ahora bien si subimos el grado del polinomio a 3 obtenemos algo como esto.
El modelo seajusta mas a los datos pero existe pequeños errores en este lado.Si ahora utilizamos
un polinomio de grado 4 obtenemos este modelo que se ajusta muchomás a nuestros datos. Siendo
éste, el modelo para este conjunto de datos.Como podemos observar se debe hacer pruebas con
distintos grados de polinomios para obtenerel que más se ajuste a nuestros datos. También es
importante destacar que, no siempreaumentar el grado del polinomio hará que el modelo mejore, en
ocasiones hace que seempeore el modelo del algoritmo, por lo que esto es solo un proceso de
experimentaciónpara obtener el más adecuado y que reduzca los errores entre el modelo y los
datos.Aunque la Regresión no Lineal suene compleja, porque involucra realizar purebas con
polinomiosde multiples grados y que puede ser cualquier número, al final no es para nada
complicadollevar esto a la practica.En fin, para saber si entendieron este algoritmo te dejo esta
pregunta para que de acuerdoa lo aprendido acá, puedas determinar la respuesta.Tienes tres
opciones en la cual deberás seleccionar cuál de los siguientes ejemplos podemos aplicarel
algoritmo de Regresión Polinomeal o no Lineal.La opción uno se refiere a predecir si una persona
está enferma tomando en cuenta sualtura, peso y temperatura. La opción dos es predecir el precio
de unaacción de la bolsa de valores, utilizando los valores históricos.Y la opción tres es predecir la
distancia en que un auto se detiene de acuerdo a lavelocidad del mismo.Recuerda que la respuesta
correcta puede ser una o varias.Deja en los comentarios de este video, cual te parece que es la
respuesta correcta.Si por el contrario quieras saber la respuesta puedes pasar por el blog, el link te
lo dejoen la cajita de información, en donde entrarás la respuesta a esta pregunta.También
encontrarás muchas más información sobre este tema, por lo que te invito a visitarlo.En caso de
que tengas alguna duda también puedes dejarlo en los comentarios y con gustote responderéCon
esto cubrimos el punto de este video correspondiente a Regresión no Lineal, espero que te
hayaquedado claro. Los invito a visitar la página web en dondeencontraran mas información sobre
este tema, el link lo dejo en la cajita de descripción.También los invito a que continuen viendo este
curso de Introducción a Machine Learningpara que aprendan más sobre este tema. Muchas gracias
por verme y nos vemos en elpróximo video. Chao.
APRENDIZAJE SUPERVISADO: SUPPORT VECTOR REGRESSION

Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine LearningEn el
video de hoy te hablare sobre el algoritmo de Soporte de Vectores de Regresión o SupportVector
Regression, en ingles.Este es un algoritmo de aprendizaje supervisado.Este algoritmo puede ser
aplicado para predicciones del tipo de regresión como para clasificación.En este video te hablare
del soporte de vectores para regresión. En el caso que te intereseconocer cómo funciona este
algoritmo para clasificación, tengo otro video con la explicaciónsobre esto. Comencemos con la
explicación de este algoritmo. Supongamos que tenemos este conjunto de datos. Lo primero que
hace este algoritmo es construir una curva o hiperplano, que modele la tendenciade los datos. Para
este ejemplo la curva sería una línea recta.A partir de este hiperplano se crean dos bandas, una en
el lado positivo o otra en el ladonegativo. Toma en cuenta que la distancia desde el hiperplano sera
la misma para ambas.Y la distancia total se le llama Máximo Margen. La idea principal con estas
bandas es quecubra la mayor cantidad posible de datos que queremos modelar para nuestro
algoritmo.Obviamente tenemos que seleccionar un hiperplano adecuado para que las bandas
cubran el mayorde los datos posibles.Ahora bien, aún con las bandas no cubrimos todos los datos,
por lo que se calcula ladistancia entre el dato y la banda más cercana. Esta distancia se le conoce
como épsilony es precisamente lo que vamos a utilizar para nuestra ecuación del modelo.Los datos
dentro del rango o las bandas no se toman en cuenta para la ecuación final.Mientras que los que se
encuentran fuera del mismo son lo que se consideran para la ecuación.Veamoslo de esta forma,
¿se acuerdan que en Regresión Lineal el modelo era simplementeuna línea, y con esa línea ibamos
a tratar de cubrir la mayor parte de nuestros datos,para de esta forma reducir el error?. Bueno, en
este caso no es una línea sino un rango,el cual cubre la mayor cantidad de datos y todos los datos
que se encuentran fuera deeste rango o bandas son los errores que pueden haber, por lo que
tenemos que considerarlosen la formula final.Con este algoritmo lo que se trata es de buscar la
curva o hiperplano que modele la tendenciade los datos y, según ella, predecir cualquier dato en el
futuro. Esta curva siempre va avenir acompañada con un margen, el cual tendrá el mismo
comportamiento o forma de la curva.Una vez que se tenga la curva y los margenes, se podrá
visualizar los datos que quedaronpor fuera y estos son considerados errores.Ahora bien, ¿qué pasa
si el problema no es lineal?.Simple. En el concepto les dije que el algoritmo sebasa en buscar la
curva que mejor se adapte a los datos,bueno, en este caso el hiperplano sera una curva que
siempre buscará adaptarse a losdatos. Acá, no es necesario buscar otro algoritmo o ecuación,
como en la Regresión Linealo no Lineal, simplemente el algoritmo se adapta a los datos.Y por
supuesto, las bandas o rangos tendrán el mismo comportamiento de la curva,
obviamenterespetando las distancias para abarcar el mayor número de datos.Y finalmente, todos
aquellos datos que se encuentren fuera del rango o bandas son consideradoserrores y se le busca
el valor de epsilon para ser incluidos en la formula. Importantemencionar, el valor de epsilon se
mide desde el dato hasta que se encuentra la primerabanda y no hasta la curva, digamosla
principal.Obviamente este algoritmo tiene algunas premisas que se deben cumplir para que se
tengan resultadosóptimos. En caso de que alguna de estas no se cumplen se deberá buscar otro
algoritmoya que con este no se obtendrán buenos resultados. La primera premisa es que los datos
debenestar limpios. Si tenemos datos con muchos errores, el algoritmo no será optimo, larazón es
muy simple todos los datos que se encuentran fuera de las bandas o rangos sonconsiderados
errores y se incluyen en la formula final, si los datos son muy dispersos no sepodrá recrear una
formula adecuada. A su vez, si no existe un patrón de comportamientoserá muy díficil generar el
hiperplano.Adicionalmente, este algoritmo no es adecuado para conjuntos de datos grandes, debido
aque el tiempo de entrenamiento puede ser alto. Si son pocos los datos se puede utilizar
estealgoritmo, pero si los datos de entrenamiento son muchos es preferible seleccionar
otroalgoritmo.Y por último, este algoritmo no es tan efectivo cuando los conjuntos de datos tienen
clasessuperpuestas, esto se refiere a características muy similares.Si las características son
similares, el comportamiento de los datos será de la mismaforma por lo que será algo complicado
determinar un modelo acorde a los datos.Espero que hayan entendido de qué se trata este
algoritmo, en teoría es sencillo peroimplementarlo requiere de mucho cálculo y ecuaciones.Les dejo
la pregunta del video para que ustedes mismo sepan o refuerce lo aprendido acá.La pregunta tiene
tres opciones a seleccionar y deberás determinar cuál de los siguientesejemplos podemos aplicar el
algoritmo de Support Vector Regression.La opción uno se refiere a predecir la temperatura de un
lugar específico de acuerdo a los datoshistóricos. La opción dos es predecir si una acciónde la
bolsa de valores, va a subir o bajar utilizando valores históricos.Y la opción tres es predecir la
distancia en que un auto se detiene de acuerdo a lavelocidad del mismo.Recuerda que la respuesta
correcta puede ser una o varias. Deja en los comentarios de estevideo cual te parece que es la
respuesta correcta. Si por el contrario quieras saber la respuestapuedes pasar por el blog, te dejo el
link en la cajita de descripción, en donde entrarásla respuesta a esta pregunta. También
encontrarás muchas más informaciónsobre este tema en el blog, por lo que te invito a visitarlo.En
caso de que tengas alguna duda también puedes dejarla en los comentarios y con gustote
responderéCon esto cubrimos el punto de este video correspondiente a Support Vector Regression,
espero que tehaya quedado claro. Los invito a visitar la página web en dondeencontraran mas
información sobre este tema, te dejo el link en la cajita de descripción.También los invito a que
continuen viendo este curso de Introducción a Machine Learningpara que aprendan más sobre este
interesante tema.Muchas gracias por verme y nos vemos en el próximo video. Chao.
APRENDIZAJE SUPERVISADO: DECISION TREE REGRESSION
Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine LearningEn el
video de hoy te hablare sobre el algoritmo de Árbol de Decisión para problemas de Regresión.En
nuestro contenido de algortimos de aprendizaje de supervisión, este sería el cuarto
queveriamos.Este algoritmo se puede utilizar tanto para problemas de regresión como de
clasificación.La mayoría de personas piensan que solamente aplica para problemas de clasificación
perola verdad es que se utliza también para regresión y funciona muy bien este algoritmo, por loque
en este video hablaremos sobre él.La base principal de este algoritmo es que evalúa todas las
variables de entrada y tambiéntodos los puntos de división posibles para seleccionar el mejor de
todos.Pero ¿por qué se llama Árbol de Decisión? Simplemente por su estructura que parece unárbol
pero al revés, veamosla con mas detalle.Este algoritmo comienza con una condición base, que
sería el tronco del árbol, deesa condición debe salir dos respuestas, si cumple o no cumple. Si
cumple tendrá unacondición, y si no cumple tendrá otra condición y, de aquí, se deriva otras
condiciones quedependerá de la cantidad de datos que se tenga disponible.Al ver la estructura final
del modelo, se puede distinguir un árbol al revés, en dondeen la parte superior se encuentra el
tronco y el resto son las ramas.Toda esta estructura tiene su nombre, veamos cada uno de
ellos.Comenzamos con el nodo raíz, que sería la primera condición de todo el algoritmo.
Vendríasiendo la base de todo.Seguidamente se tienen los nodos de pruebas, que serían todas las
condiciones y pruebasque se deben realizar para llegar a un resultado.Y finalmente se tiene los
nodos de decisión, que sería el resultado o predicción de nuestroalgoritmo.Como este es un
algoritmo de aprendizaje supervisado es necesario que se introduzca las variablesindependiente y
dependiente. La variable independiente o características,es la que se manipula para determinar el
valor de una variable dependiente. Dicho de maneramás sencilla, son las características que
usamos para predecir algún valor dadode y. La variable dependiente u objetivo, es laque depende
de los valores de la variable independiente. En pocas palabras, es la característicaque estamos
tratando de predecir. Esto también se puede conocer comúnmente como una variablede respuesta.
Pero me imagino que te estas preguntando,¿cómo funciona este algoritmo
exactamente?.Supongamos que tenemos estos datos. Como se observa se encuentran distribuidos
aleatoriamentey no forman ningún patron específico, por lo que el algoritmo que ya vimos de
Vectoresde Soporte de Regresión no puede ser aplicado.Entonces, lo primero que tenemos que
hacer es separar los datos, esto se realiza de maneraaleatoria sin seguir ningún patrón
específico.Realizada este primera separación podemos realizar tantas separaciones de los
datoscomo nos parezca.Al final, cada una de estas separaciones será una condición dentro de
nuestro algoritmoy de esta forma podremos construir nuestro Árbol de Decisión.Veámoslo de
manera práctica.En este ejemplo estaremos separando los datos y a su vez armando el Árbol de
Decisión.Tenemos la siguiente data. El primer paso que debemos hacer es realizar la primera
separación,la misma se hace de manera aleatoria. Para nuestro caso vamos a hacer la división
acá,sobre el 30 del eje X1. Armando nuestro árbol comenzaremos a colocar las pruebas, en
estecaso podemos colocar la condición si X1 es menor a 30. Y se abre dos condiciones Si oNo.
Continuando con nuestro análisis debemosrealizar una nueva separación en la data para continuar
armando nuestro árbol. Estadivisión la hacemos acá, sobre el eje X2, ubicada exactamente sobre
65. Esta pruebaestará ubicado, en nuestro árbol, en el lado positivo de la condición anterior, yaque
se está separando los datos menores a 30.Por lo tanto colocamos esta nueva condición en los
datos, si X2 es menor a 65. Y seguidamentese abren dos condiciones nuevamente, si es positiva la
respuesta o si por el contrarioes negativa. Si observamos esta rama del árbol, podemosver que acá
estarán clasificados todos los datos que sean menores a 30 en el eje X1,y a su vez estos datos se
vuelven a clasificar si son menores o mayores a 65 en el eje X2.Continuemos armando nuestro
algoritmo, para ello realizamos una nueva separación de losdatos. Esta vez separamos todos los
datos mayoresde 30 sobre el eje X1. Acá colocamos una nueva separación en 50 sobre el eje
X2.Entonces colocando esta prueba sobre nuestro Árbol de Decisión, la ubicamos en el
ladonegativo de la condición X1 menor a 30 y la condición sería si X2 es menor a 50,y de igual
forma la dividimos en dos condiciones positivas y negativa.Ahora bien, podemos hacer una nueva
divisiónen los datos para tener una predicción más exacta. Esta vez hacemos la división en
losdatos menores a 50 y la ubicamos acá. Esta nueva división hace que la agreguemosa nuestro
árbol, obviamente en el lado positivo de la condición anterior, en donde indicabaque X1 no es
menor a 30 y a su vez X2 es menor a 50.La nueva condición sería X1 es menor a 70 y abrimos
nuevamente a dos opciones, positivay negativa. Hasta acá podemos dejar la separación delos datos
porque es aceptable, aunque si lo deseamos podemos continuar para refinar másla predicción.
Ahora bien ¿cómo podemos rellenar los cuadrosen blanco que dejamos?, que serían nuestros
nodos de decisión.Pues tenemos que calcular el promedio de todos los datos corresponientes a
cada zona, deacuerdo a las separaciones que realizamos. Como podemos observar tenemos la
Zona A, quevendrían siendo los datos menores a 30 de X1 y menores de 65 de X2.La Zona B que
vendrían siendo los datos menores a 30 de X1 y mayores de 65 de X2, y así sucesivamente.Acá lo
que tenemos que hacer es tomar todos los datos ubicados en cada zona y calcularel promedio y
este valor será el que coloquemos en los nodos de decisión.Al final de todo este proceso, este árbol
será nuestro modelo del algoritmo de Árbolde Decisión y es el que utilizaremos para predecir con
un nuevo valor.Entonces veamos este modelo en acción. Queremos predecir este nuevo valor que
esta ubicadoacá. Cómo ya tenemos nuestro modelo no es necesarioseguir utilizando la data de
entrenamiento por lo que no es necesario graficarla.Entonces lo primero que debemos hacer es ver
donde esta ubicado este punto tanto en eleje X1 y X2. Por lo que ahora podemos seguir nuestro
modelo.La primera condición que encontramos es que si X1 es menor a 30. Como podemos
observarla respuesta es no porque el valor esta ubicado en un valor mayor a 30, por lo que la
ramaque debemos seguir acá es la de no. La siguientes prueba o condición que nosencontramos es
que si X2 es menor a 50, en este caso la respuesta es si, ya que el valoren donde esta ubicado
nuestro punto se encuentra por debajo a 50. Entonces continuamos poresta rama positiva. La
siguiente condición que nos encontramoses que si X1 es menor a 70, porque como observamos el
puntose encuentra graficado antes del 70, por lo que la respuesta a esta condición es sí.Entonces
la predicción para este problema será el valor promedio de los datos ubicadosen la Zona D. Este
algoritmo es relativamente fácil deelaborar y de explicar, lo importante acá es hacer una buena
separación de los datos.Como podemos observar este algoritmo tiene varias ventajas entre ellas se
encuentran:Es fácil de entender. La salida del Árbol de Decisión es muy fácil de entender,
inclusopara personas con antecedentes no analíticos, no se requiere ningún conocimiento
estadísticopara leerlos e interpretarlos.Es útil en la exploración de datos. El Árbol de Decisiones es
una de las formas más rápidaspara identificar las variables más significativas y la relación entre dos
o más. Con la ayudade los árboles de decisión podemos crear nuevas variables o características
que tenganmejor poder para predecir la variable objetivo.A diferencia del Soporte de Vectores de
Regresión este algoritmo requiere menos limpieza dedatos. A su vez, no esta influenciado por los
valores atipicos y faltantes en la data.Adicionalmente, el tipo de datos no es una restricción. Puede
manejar variables numéricasy categóricas.Pero como todo algoritmo tiene sus desventajas y uno de
ellas es que no es apto para variablescontinuas. Al trabajar con variables numéricas continuas se
pierde información cuando categorizavariables en diferentes categorias. Pero a pesar de todo es un
excelente algoritmoque puede ser utlizado en muchos problemas de regresión.Espero hayan
entendido de qué se trata este algoritmo. Les dejo la pregunta del videopara que ustedes mismo
sepan o refuerce lo aprendido.Igual que en los casos anteriores, se tienen tres opciones y deberás
determinar cuálde los siguientes ejemplos podemos aplicar el algoritmo de Árbol de Decisión
Regresión.La opción uno se refiere a predecir la temperatura de un lugar específico de acuerdo a
los datoshistóricos. En la opción dos tienes que predecir si unaacción de la bolsa de valores va a
subir o bajar utilizando los valores históricos.Mientras que en la opción tres puedes predecir si una
persona puede vivir o morir en el hundimientodel Titanic, tomando en cuenta la edad, sexo y
ubicación de su cabina.Recuerda que la respuesta correcta puede ser una o varias. Deja en los
comentarios de estevideo cual te parece que es la respuesta correcta. Si por el contrario quieras
saber la respuestapuedes pasar por el blog, el link te lo dejo en la cajita de descripción, en donde
entrarásla respuesta a esta pregunta. También encontrarás muchas más informaciónsobre este
tema en el blog, por lo que te invito a visitarlo.En caso de que tengas alguna duda también puedes
dejarlo en los comentarios y con gustote responderé.Con esto cubrimos el punto de este video
correspondiente a Árbol de Decisión de Regresión, esperoque te haya quedado claro. Los invito a
visitar la página web en dondeencontraran mas información sobre este tema, les dejo el link en la
cajita de descripción.También los invito a que continuen viendo este curso de Introducción a
Machine Learningpara que aprendan más sobre este interesante tema.Muchas gracias por verme y
nos vemos en el próximo video. Chao.
APRENDIZAJE SUPERVISADO: RANDOM FOREST REGRESSION

Hola a todos y bienvenidos a un nuevo video del curso de Introducción a Machine Learning.En el
video de hoy te hablare sobre el algoritmo de Bosques Aleatorios para problemas de Regresión.En
nuestro contenido de algortimos de aprendizaje de supervisión este sería el último algoritmoque
veríamos sobre regresión.Al igual que otros algoritmos que ya hemos visto, este puede ser utilizado
para datos de regresióncomo de clasificación. Pero hoy te voy a hablar especificamente de
regresión.Para entender mejor este video te recomiendo veas primero el video de árboles de
decisiónde regresión ya que este algoritmo tiene sus bases acá.Ahora bien ¿de qué se trata este
algoritmo?. Como su nombre lo sugiere este algoritmo creael bosque con varios árboles de
decisión. Cuanto más árboles haya en el bosque másrobusto será el bosque y por ende la precisión
del algoritmo.Veamoslo gráficamente, tenemos esta data, la misma la podemos dividir en tres para
creartres árboles de decision.Creamos nuestros árboles de decisión como normalmente se hace en
este algoritmo queya te explique antes y cuando tengas la decisión de cada uno de ellos las
juntamos y calculamosel promedio. Recuerda que estos son problemas de regresión por lo que
siempre los resultadosserán números. Este promedio será la predicción del modelo.Al igual que
todos los problemas de aprendizaje supervisado siempre tenemos que tener lasvariables
independientes y dependientes. En donde la variable independiente o características, es la que se
manipula para determinar el valor de una variable dependiente. Dicho de manera más sencilla, son
las características que queremos usar para predecir algún valor dadode y. La variable dependiente
u objetivo, es laque depende de los valores de la variable independiente. En pocas palabras, es la
característicaque estamos tratando de predecir. Esto también se puede conocer comúnmente como
una variablede respuesta.Ahora si, veamos este algoritmo con un ejemplo. Tenemos el Bosque
Aleatorios con sus respectivosÁrboles de Decisión presentados anteriormente. Pero esta vez a
cada nodo final o de decisiónle asignamos un valor númerico, que vendría siendo el valor resultado
después de cadauno de los análisis respectivo de los árboles. Para obtener el valor final de la
predicción,debemos tomar los datos resultantes de cada árbol y promediarlos, el resultado serála
predicción a nuestro problema.Unos de los beneficios que más llama la atención es la de poder de
manejar grandes cantidadesde datos con mayor dimensionalidad. Puede manejar miles de variables
de entrada e identificarlas variables más significativas, por lo que se considera uno de los métodos
de reducciónde dimensionalidad. Además el modelo muestra la importancia de la variable, que
puede seruna característica muy útil.Adicionalmente tiene un método efectivo para estimar datos
faltantes y mantiene la precisióncuando falta una gran proporción de los datos.Hace un buen trabajo
en la clasificación, pero no es tanto bueno como para los problemasde regresión, ya que no
proporciona predicciones precisas y continuas sobre la naturaleza.En caso de regresión, no predice
más allá del rango en los datos de entrenamiento, yque pueden sobreajustar los conjuntos de datos
que son particularmente ruidosos.Espero hayan entendido de qué se trata este algoritmo. Les dejo
la pregunta del videopara que ustedes mismo sepan o refuerce lo aprendido acá.En la pregunta del
video deberás seleccionar cuál de los siguientes ejemplos podemos aplicarel algoritmo de Bosques
Aleatorio de Regresión. La opción uno se refiere a predecir la enfermedadde un paciente tomando
en cuenta los sintomas que presenta.La opción dos es predecir el precio de una acción de la bolsa
de valores, tomando encuenta los datos históricos. Mientras que la opción tres es predecir siuna
persona vive o muere en el hundimiento del Titanic, tomando en cuenta la edad, sexoy la ubicación
de su cabina.Recuerda que la respuesta correcta puede ser una o varias. Deja en los comentarios
de estevideo cual te parece que es la respuesta correcta. Si por el contrario quieras saber la
respuestapuedes pasar por el blog, el link te lo dejo en la cajita de descripción, en donde entrarásla
respuesta a esta pregunta. En caso de que tengas alguna duda tambiénpuedes dejarla en los
comentarios y con gusto te responderé.Con esto cubrimos el punto de este video correspondiente a
Bosques Aleatorios de Regresión, esperoque te haya quedado claro. Los invito a visitar la página
web en dondeencontraran mas información sobre este tema, les dejo el link en la cajita de
descripición.También los invito a que continuen viendo este curso de Introducción a Machine
Learningpara que aprendan más sobre este interesante tema.Muchas gracias por verme y nos
vemos en el próximo video. Chao.
APRENDIZAJE SUPERVISADO: LOGISTIC REGRESSION

video de hoy te hablare sobre el algoritmo de Regresión Logística.Este sería el primer algoritmo de
clasificación que vemos en nuestro curso. Y sí, es un algoritmode clasificación a pesar de llevar en
el nombre la palabra regresión.La Regresión Logística es un algoritmo de clasificación que se utiliza
para predecirla probabilidad de una variable dependiente categórica. En la Regresión Logística,la
variable dependiente es una variable binaria que contiene datos codificados como 1 - 0,sí y no,
abierto – cerrado. Este modelo logístico binario se utilizapara estimar la probabilidad de una
respuesta binaria basada en una o más variables predictoraso independientes.Al igual que todos los
algoritmos de aprendizaje supervisado acá también se manejan las variablesindependientes y las
variables dependientes, por lo que corresponde definirlas para aquellosque aún no lo tengan
claro.La variable independiente o características, es la que se manipula para determinar el valorde
una variable dependiente. Dicho de manera más sencilla, son las características quequeremos usar
para predecir algún valor dado de y.Por su parte, la variable dependiente u objetivo, es la que
depende de los valores de la variableindependiente. En pocas palabras, es la característica que
estamos tratando de predecir. Esto tambiénse puede conocer comúnmente como una variable de
respuesta.Ahora bien veamos un ejemplo de este algoritmo, tenemos los datos del tamaño de
tumores,que sería nuestra variable independiente y a su vez, tenemos el tipo de tumor, si
esbenigno o maligno, este sería nuestra variable dependiente. Estos datos son ingresados enel
algoritmo y lo que deberá predecir será el tipo de tumor, benigno o maligno.Como ven existen
solamente dos opciones, es una o la otra, es decir la predicción seráuno de estas dos, razón por la
cual este es un algoritmo de clasificaicón.Si vemos gráficamente esta información vemos que los
datos se agrupan en estos dos, ceropara cuando el tumor es benigno y uno para cuando el tumor es
maligno.Teniendo esta información queremos predecir si un tumor de tamaño 7 es maligno o
benigno.Para esta caso se calcula el modelo, que igual que en el caso de la Regresión Lineal esuna
recta y de acuerdo a esto podemos realizar la predicción.Entonces introducimos, al algoritmo, el
valor del tamaño del tumor que queremos predecir,en este caso sería 7. Y de acuerdo a esto
realizamos la predicción.Para este ejemplo es muy obvio el resultado, que sería maligno, pero en la
gran mayoríade los casos los datos no están perfectamente distribuidos como estos por lo que la
predicciónno es tan fácil de visualizar.Como el resto de los algoritmos que ya hemos visto, acá las
variables deben cumplir conciertos criterios para obtener una predicción precisa. Alguno de ellos
son los siguientes:Variable de salida es binaria. Esto puede ser obvio, pero la Regresión Logística
estádestinada a problemas de clasificación binarios (dos clases). Predicará la probabilidad deque
una instancia pertenezca a la clase predeterminada, que puede dividirse en una clasificación0 ó
1.La Regresión Logística no asume ningún error en la variable de salida (y), por loque considera la
eliminación de los valores atípicos y posiblemente las instancias malclasificadas de sus datos de
entrenamiento.La Regresión Logística es un algoritmo lineal, con una transformación no lineal en la
salida.Asume una relación lineal entre las variables de entrada con la salida. Las
transformacionesde datos de sus variables de entrada que exponen mejor esta relación lineal
pueden dar comoresultado un modelo más preciso.La Regresión Logística requiere tamaños de
muestra bastante grandes para obtener unpredicción correcta.Ahora veamos este ejemplo en donde
tenemos como variables independientes la altura, pesoy temperatura y con toda esta información
podemos determinar si la persona se encuentraenferma o no, siendo está la variable
dependiente.Como ya lo hemos mencionado antes no importa la cantidad de variables
independiente que tengamos,en ocasiones, no siempre, es conveniente tener varias variables de
independientes para teneruna mejor predicción. Por ejemplo en este caso es mejor tener todaesta
información para al final predecir si la persona se encuentra enferma o no.La razón por la cual la
Regresión Logística es ampliamente utilizada a pesar de los algoritmosavanzados como redes
neuronales profunda es porque es muy eficiente y no requiere demasiadosrecursos
computacionales que hacen que sea asequibles ejecutar la producción.Espero hayan entendido de
qué se trata este algoritmo. Les dejo la pregunta del videopara que ustedes mismo sepan o refuerce
lo aprendido acá.En la pregunta del video deberás seleccionar cuál de los siguientes ejemplos
podemos aplicarel algoritmo de Regresión Logística. La opción uno se refiere a predecir la
temperaturade un lugar específico de acuerdo a los datos históricos.La opción dos es predecir el
valor de una acción de la bolsa de valores de acuerdoa los datos históricos. Y por último la opción
tres es predecirsi una persona puede vivir o morir en el hundimiento del Titanic, tomando en cuanta
la edad, sexoy la ubicación de su cabina.Recuerda que la respuesta correcta puede ser una o
varias. Deja en los comentarios de estevideo cual te parece que es la respuesta correcta. Si por el
contrario quieras saber la respuestapuedes pasar por el blog, el link te lo dejo en la cajita de
descripción, en donde entrarásla respuesta a esta pregunta. En caso de que tengas alguna duda
tambiénpuedes dejarlo en los comentarios y con gusto te responderé.Con esto cubrimos el punto de
este video correspondiente a Regresión Logística, espero que te hayaquedado claro. Los invito a
visitar la página web en dondeencontraran mas información sobre este tema, les dejo el link en la
cajita de descripción.También los invito a que continuen viendo este curso de Introducción a
Machine Learningpara que aprendan más sobre este tema. Muchas gracias por verme y nos vemos
en elpróximo video. Chao.
APRENDIZAJE SUPERVISADO: K-NEAREST NEIGHBORS

video de hoy te hablare sobre el algoritmo de Vecinos más Cercanos o K-nearest Neighbors.Este es
un algoritmo de clasificación perteneciente también del aprendizaje supervisado.La mejor manera
de entenderlo es con un ejemplo, por lo que tenemos esta data, como se puedeobservar tenemos
dos tipos de datos triangulos y circulos. Recuerda que este es un algoritmode clasificación.Ahora
bien, queremos predecir a qué clasificación pertenece este punto.Entonces como el nombre del
algoritmo lo indica, lo que verificamos son los datos que se encuentranmás cercano y este será la
respuesta a nuestro problema.Lo primero que tenemos que hacer en este algoritmo es seleccionar
un valor de K, para este ejemploseleccionamos K igual uno, entoces buscamos el primer valor más
cercano al punto quequeremos predecir, en este caso sería un tringulo por lo que la solución a este
problemasería que este dato pertenece al conjunto del triangulo.Pero colocar el valor de K como
uno, puede ser que caigamos en errores, por lo que elvalor de K siempre debe ser mayor a uno, ya
que de esta forma nos aseguramos a tener unamayor precisión en la predicción. Por lo tanto
volvamos a hacer el análisiscambiando el valor de K ahora será dos, por lo que procedemos a
verificar los dos datosmás cercanos que se encuentran del punto que queremos predecir, en este
caso la predicciónes consiste los dos datos seleccionados son triangulos por lo que ya podemos
confirmarque la predicción de este problema será triangulo.Como puedes ver este es un algoritmo
de clasificación muy simple, incluso con tal simplicidad puededar resultados altamente competitivos.
Puede ser utilizado para el reconocimiento de patrones,extracción de datos y detección de intrusos.
Es un clasificador robusto y versátil quea menudo se usa como un punto de referencia para
clasificadores más complejos como lasredes neuronales artificiales y vectores de soporte. A pesar
de su simplicidad, puedesuperar a los clasificadores más potentes y se usa en una variedad de
aplicaciones talescomo pronósticos económicos, compresión de datos y genética.Veamos este
nuevo ejemplo, acá tenemos dos conjuntos de datos graficados como se muestra,y queremos
predecir a qué conjunto pertenece este dato.Como dijimos anteriormente, lo primero que debemos
hacer es seleccionar un valor de K,en este caso le colocamos el valor de dos. Inmediatamente se
seleccionan los dos valoresmás cercanos al punto a predecir. Si nos guiamos con esta solución
podemos decir quela predicción a este problema es que el punto es un rombo.Ahora bien que pasa
si definimos un valor para K mayor, en este caso le colocamos 3,por lo que seleccionamos los 3
datos más cercanos, en este caso toma dos valores enforma de rombo y uno en forma de cuadrado.
Por lo que, por mayoría, la predicción deeste punto sería un rombo, igual que en el caso anterior.SI
volvemos aumentar el valor de K y ahora le ponemos un valor 4, podemos observar queahora toma
dos valores en forma de rombo y dos valores en forma de cuadrado, por lo queno se puede definir
una predicción adecuada, ya que la respuesta no tiene ninguna clasificación,con datos mayores
claros. Con este ejemplo nos podemos dar cuenta queno siempre aumentar el valor de K hace que
la predicción sea precisa, sino al contrariopuede ser que nos de una respuesta erronéa. Acá lo
importante es probar con varios valoresde K para obtener una buena clasificación.Una de las
ventajas que tiene este algoritmo es que no hace suposiciones explícitas sobrela forma funcional de
los datos, evitando los peligros de la distribución subyacentede los datos.A su vez, el algoritmo no
aprende explicitamente un modelo, en su lugar, elige memorizar lasinstancias de capacitación que
se utilizan posteriormente como conocimiento para la fasede predicción. Concretamente, esto
significa que solo cuando se realiza una consulta anuestra base de datos, es decir cuando le
pedimos que prediga una etiqueta dada unaentrada, el algoritmo usará las instancias de
entrenamiento para generar una respuesta.A raíz de esto este algoritmo es computancionalmente
costoso, ya que debe almacenar todos los datosde entrenamiento requiriendo tener una memoria
alta para poder almacenarlos.Espero hayan entendido de qué se trata este algoritmo. Les dejo la
pregunta del videopara que ustedes mismo sepan o refuerce lo aprendido acá.Te doy tres opciones
en donde debes seleccionar cuál de los siguientes ejemplos podemos aplicarel algoritmo de K-
nearest Neighbors. La opción uno se refiere a predecir el tipode flor de acuerdo a las características
dadas.La opción dos es predecir si una acción de la bolsa de valores va a subir o bajarutilizando los
valores históricos. Y la opción tres es predecir si una personapuede vivir o morir en el hundimiento
del Titanic tomando en cuanta la edad, sexo yubicación de su cabina.Recuerda que la respuesta
correcta puede ser una o varias. Deja en los comentarios de estevideo cual te parece que es la
respuesta correcta. Si por el contrario quieras saber la respuestapuedes pasar por el blog, el link te
lo dejo en la cajita de descripción, en donde encontrarásla respuesta a esta pregunta. En caso de
que tengas alguna duda tambiénpuedes dejarlo en los comentarios y con gusto te responderé.Con
esto cubrimos el punto de este video correspondiente a K-Nearest Neighbors o Vecinos más
cercanos,espero que te haya quedado claro. Los invito a visitar la página web en dondeencontraran
mas información sobre este tema, les dejo el link en la cajita de descripción.También los invito a
que continuen viendo este curso de Introducción a Machine Learningpara que aprendan más sobre
este tema. Muchas gracias por verme y nos vemos en elpróximo video. Chao.
APRENDIZAJE SUPERVISADO: SUPPORT VECTOR MACHINE

video de hoy te hablare sobre el algoritmo de Vectores de Soporte de Máquinas o SupportVector
Machine en inglés.Este es un algoritmo de clasificación perteneciente también del aprendizaje
supervisado.Este algoritmo puede ser aplicado para predicciones del tipo de clasificación como
para regresión.En este video te hablare del soporte de vectores para clasificación. En el caso que te
intereseconocer cómo funciona este algoritmo para regresión, tengo otro video con la
explicaciónsobre esto, te dejo el link en la cajita de descripción.Este algoritmo es un clasificador
discriminatorio definido formalmente por un hiperplano deseparación. En otras palabras, dados los
datos de entrenamiento etiquetados, el algoritmogenera un hiperplano óptimo que clasifica los
nuevos ejemplos en dos espacios dimensionales,este hiperplano es una linea que divide un plano
en dos partes donde en cada clase seencuentra en cada lado. Pero veamos esto en un ejemplo
para que seamás fácil de entender.Supongamos que tenemos estos datos, lo primero que debemos
hacer es establecer el hiperplano,el cual separará en dos el plano. Pero este hiperplano puede
estar en cualquierposición como esta.O esta. En ambos caso el hiperplano separa perfectamente en
dos los datos pero lo ideales buscar una posición adecuada algo como esto.Una vez definido el
hiperplano creamos dos líneas paralelas tanto en el lado positivocomo en el lado negativo. Estas
líneas se crean utilizando los vectores de soportes,es decir los datos de ambos planos, más
cercanos al hiperplano se utilizaran como soportesy como guías para estas nuevas líneas, que
crearán una banda o rango entre los datos.Esta lleva por nombre Margen Máximo.Y estos serán los
vectores de soportes para este ejemplo.Y te preguntarás ¿por qué se llaman vectores de soporte?
La razón es muy simple y es porquea pesar de que se vean representados como un punto o una
figura, para este caso, enel plano, al final son vectores, como ves acá.Entonces justamente estos
vectores son los que utilizaremos para crear nuestras bandas,que al final van a crear el hiperplano
positivo y el hiperplano negativo.Y todo lo que cae en cada uno de los hiperplanos será clasificado
igual a los datos correspondientesa ese hiperplano, en este caso serán peras o manzanas.Veamos
otro ejemplo, tenemos este conjunto de datos de perros y gatos de distintas razas.Para ellos
creamos nuestros modelo de Vectores de Soporte.Ahora bien queremos clasificar este nuevo
animal, debemos determinar si es un perroo un gato. Cuando lo graficamos se presenta acá,
ubicado en el hiperplano negativo endonde están ubicados los perros, por lo que la clasificación
daría como resultado quees un perro.Pero ¿qué pasa si los datos no son lineales?Bueno este
algoritmo permite utilizar funciones llamadas Kernel en donde se pueden llevarlos datos al espacio
donde convierte el hiperplano en una solución lineal lo quehace más sencillo utilizar este modelo.
Veamos como en esta gráfica le agregamosun nuevo eje que sería el eje Z y los datos se
convirtieron en lineales por lo que crearel hiperplano es mucho más fácil.Una vez que se haya
conseguido la solución, se transforma nuevamente al espaciooriginal quedando algo como esto, los
datos originales pero a su vez el hiperplano.Entre las característica que tiene este algoritmo
están:Para datos linealmente separables, este algoritmo funciona increiblemente bien.Para los
datos que son casi linealmente separables, este algoritmo puede funcionar bien con elvalor correcto
de hiperplano. Y para los datos que no son separables linealmente,podemos proyectarlos al espacio
donde es perfectamente o casi linealmente separable.Espero hayan entendido de qué se trata este
algoritmo. Les dejo la pregunta del videopara que ustedes mismo sepan o refuerce lo aprendido
acá.Al igual que en las otras ocasiones, te doy tres opciones en donde debes seleccionar cuálde los
siguientes ejemplos podemos aplicar el algoritmo de Vectores de Soporte.La opción uno se refiere a
predecir el tipo de flor de acuerdo a las característicasdadas. La opción dos es predecir si una
acciónde la bolsa de valores va a subir o bajar utilizando los valores históricos.Y la opción tres es
predecir si una persona puede vivir o morir en el hundimiento delTitanic tomando en cuanta la edad,
sexo y ubicación de su cabina.Recuerda que la respuesta correcta puede ser una o varias. Deja en
los comentarios de estevideo cual te parece que es la respuesta correcta. Si por el contrario quieras
saber la respuestapuedes pasar por el blog, el link te lo dejo en la cajita de descripción, en donde
encontrarásla respuesta a esta pregunta. En caso de que tengas alguna duda tambiénpuedes
dejarlo en los comentarios y con gusto te responderé.Con esto cubrimos el punto de este video
correspondiente a Support Vector Machine, espero que te hayaquedado claro. Los invito a visitar la
página web en dondeencontraran mas información sobre este tema, les dejo el link en la cajita de
descripción.También los invito a que continuen viendo este curso de Introducción a Machine
Learningpara que aprendan más sobre este tema. Muchas gracias por verme y nos vemos en
elpróximo video. Chao.

Machine Learning 2

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Machine Learning 2

Cargado por

Copyright:

Formatos disponibles

¿Pero por qué es necesario aprender sobre Machine Learning hoy en día?

En 1979 los estudiantes de la Universidad de Stanford, diseñan un carro capaz de moverse

En el 2010 el Kinect de Microsoft es capaz de reconocer 20 características del cuerpo humano a

En el 2012 los laboratorios Google X, ahora llamado solamente X o X, desarrollan un algoritmo de

DEFINICIÓN DE MACHINE LEARNING

CLASIFICACIÓN DE MACHINE LEARNING

APRENDIZAJE SUPERVISADO: LINEAR REGRESSION

APRENDIZAJE SUPERVISADO: SUPPORT VECTOR REGRESSION

APRENDIZAJE SUPERVISADO: RANDOM FOREST REGRESSION

APRENDIZAJE SUPERVISADO: LOGISTIC REGRESSION

APRENDIZAJE SUPERVISADO: K-NEAREST NEIGHBORS

APRENDIZAJE SUPERVISADO: SUPPORT VECTOR MACHINE

También podría gustarte