Está en la página 1de 17

¿Qué es el aprendizaje automático?

Transcripción interactiva

Buscar transcripción

Inglés

0:00

¿Qué es el aprendizaje automático? En este video intentaremos definir qué es y también


intentar para darle una idea de cuándo desea usar el aprendizaje automático. Incluso entre
máquinas los profesionales del aprendizaje no es una definición bien aceptada de lo que es y lo
que no es aprendizaje automático Pero déjame mostrarte un par de ejemplos de las formas en
que la gente ha intentado definirlo. Aquí está la definición de lo que es el aprendizaje
automático a Arthur Samuel. Definió el aprendizaje automático como el campo de estudio que
da

0:31

las computadoras tienen la capacidad de aprender sin estar explícitamente programadas. El


reclamo de Samuel de la fama fue que en la década de 1950, escribió un programa de juego de
damas. Y el Lo mejor de este programa de juego de damas fue Arthur Samuel, no era un muy
buen jugador de damas. Pero lo que hizo fue, tuvo que programarlo para jugar 10 de 1000 de
juegos contra sí mismo. Y mirando qué tipo de tabla posiciones tendían a conducir a victorias,
y qué tipo de posiciones de la junta tendían a llevar a pérdidas. El programa de juego de damas
se entera con el tiempo de qué es un buen tablero posiciones y cuáles son las malas posiciones
de la junta. Y eventualmente aprendes a jugar damas mejor que Arthur Samuel mismo fue
capaz de hacerlo. Este fue un resultado notable. Aunque el propio Samuel resultó no ser un
jugador de damas muy bueno. Pero porque el la computadora tiene la paciencia de jugar
decenas de miles de juegos en sí. No humano, tiene la paciencia para jugar tantos juegos. Al
hacer esto, la computadora pudo para obtener tanta experiencia jugando damas que
eventualmente se convirtió en una mejor jugador de damas que el propio Arthur Samuel. Esto
es algo informal definición, y una más antigua. Aquí hay una definición un poco más reciente
de Tom Mitchell, que es amigo de Carnegie Mellon. Entonces, Tom define el aprendizaje
automático por diciendo que, un problema de aprendizaje bien planteado se define de la
siguiente manera. Él dice, una computadora Se dice que el programa aprende de la experiencia
E, con respecto a alguna tarea T, y algo Medida de rendimiento P, si su rendimiento en T
medido por P mejora con experiencia E. De hecho, creo que se le ocurrió esta definición solo
para hacerlo rima. Para las damas que juegan ejemplo, la experiencia e, será la experiencia de
tener el programa jugando 10's de juegos de 1000 contra sí mismo. los tarea t, será la tarea de
jugar damas. Y la medida de rendimiento p, será la probabilidad de que gane el próximo juego
de damas contra un nuevo oponente A lo largo de estos videos, además de tratar de enseñarte
cosas, ocasionalmente te haré una pregunta para asegurarte de que entiendes el contenido.
Aquí hay una, en la parte superior hay una definición de aprendizaje automático de Tom
Mitchell. Digamos que su programa de correo electrónico mira qué correos electrónicos hace o
no marca como spam. Entonces, en un cliente de correo electrónico como este, puede hacer
clic en este botón de spam para informar algunos correos electrónicos como correo no
deseado, pero no otros correos electrónicos y. Según qué correos electrónicos marque como
correo no deseado, por lo que su programa de correo electrónico aprende mejor cómo filtrar
correo electrónico no deseado. Cuál es el tarea T en este ajuste? En unos segundos, el video se
detendrá. Y cuando lo hace, puede usar su mouse para seleccionar uno de estos cuatro
botones de radio para dejarlo, para dejarme saber cuál de estos cuatro piensas que es la
respuesta correcta a esta pregunta. Eso podría ser una medida de rendimiento P. Y así, nuestro
desempeño de tareas en la tarea de nuestro sistema rendimiento en la tarea T, en la medida
de rendimiento P mejorará después la experiencia E. En esta clase espero enseñarte sobre
varios tipos diferentes de algoritmos de aprendizaje. Hay varios tipos diferentes de algoritmos
de aprendizaje. Los dos tipos principales son lo que llamamos aprendizaje supervisado y no
supervisado aprendizaje. Definiré lo que estos términos significan más en los próximos videos.
Pero resulta que en el aprendizaje supervisado, la idea es que vamos a enseñar el
computadora cómo hacer algo, mientras que en el aprendizaje no supervisado vamos a dejar
aprende solo No se preocupe si estos dos términos todavía no tienen sentido, en el Los
próximos dos videos voy a decir exactamente cuáles son estos dos tipos de aprendizaje. Tú
también escuchará otros términos de moda, como aprendizaje de refuerzo y recomendación
sistemas. Estos son otros tipos de algoritmos de aprendizaje automático de los que
hablaremos más tarde, pero los dos tipos más utilizados de algoritmos de aprendizaje son
probablemente aprendizaje supervisado y aprendizaje no supervisado y los definiré en el
próximo dos videos y pasaremos la mayor parte de esta clase hablando de estos dos tipos de
algoritmos de aprendizaje. Resulta que una de las otras cosas pasaremos mucho tiempo en
esta clase hay consejos prácticos para aplicar algoritmos de aprendizaje. Esto es algo con lo
que me siento muy convencido, y en realidad es algo que No sé de ninguna otra universidad
enseña. Enseñanza sobre el aprendizaje algoritmos es como darle un conjunto de
herramientas, e igualmente importante o más importante darle las herramientas es enseñarle
cómo aplicar estas herramientas. me gusta hacer una analogía para aprender a ser carpintero.
Imagina que alguien es enseñando cómo ser un carpintero y dicen que aquí hay un martillo,
aquí hay un destornillador, aquí hay una sierra, buena suerte. Bueno, eso no está bien,
¿verdad? Tú tú tú tener todas estas herramientas, pero lo más importante, es aprender a usar
estas herramientas correctamente Hay una gran diferencia entre, entre personas que saber
cómo usar estas máquinas aprendiendo algoritmos, versus personas que no saben cómo usar
estas herramientas bien Aquí en Silicon Valley, donde vivo, cuando voy visitar diferentes
empresas, incluso en la parte superior de las empresas de Silicon Valley que a menudo veo la
gente está tratando de aplicar algoritmos de aprendizaje automático a algún problema y a
veces lo han estado haciendo durante seis meses. Pero a veces cuando miro lo que están
haciendo yo, yo, digo, ya sabes, podría haberles dicho que, bueno, podría le dijimos hace seis
meses que debería tomar un algoritmo de aprendizaje y aplicándolo como la manera
ligeramente modificada y sus posibilidades de éxito tendrían sido mucho más alto. Entonces, lo
que vamos a hacer en esta clase es gastar mucho de tiempo hablando de cómo, si realmente
trataste de desarrollar una máquina de aprendizaje sistema, cómo hacer que esas mejores
prácticas tomen decisiones sobre la forma en que construye tu sistema para que cuando estés
aplicando el algoritmo de aprendizaje seas menos probable que termine siendo una de esas
personas que terminan siguiendo un camino durante seis meses eso, ya sabes, alguien más
podría haberse dado cuenta de que simplemente no iba a funcionar en todo y es solo una
pérdida de tiempo durante seis meses. Entonces voy a gastar un muchas veces enseñándole
ese tipo de mejores prácticas en aprendizaje automático y AI y cómo hacer que esto funcione y
cómo lo hacemos, cómo lo hacen las mejores personas en Silicon Valley y alrededor del
mundo. Espero hacerte una de las mejores personas en saber cómo diseñar y construir
sistemas serios de aprendizaje automático y IA. Asi que, eso es aprendizaje automático y estos
son los temas principales que espero enseñar. En el proximo video, voy a definir qué es el
aprendizaje supervisado y después de eso, qué es aprendizaje sin supervisión. Y también,
comience a hablar sobre cuándo usaría cada uno de ellos.

¿Qué es el aprendizaje automático?


Se ofrecen dos definiciones de Machine Learning. Arthur Samuel lo describió como: "el
campo de estudio que da a las computadoras la capacidad de aprender sin estar
programado explícitamente". Esta es una definición más antigua e informal.

Tom Mitchell proporciona una definición más moderna: "Se dice que un programa de
computadora aprende de la experiencia E con respecto a una clase de tareas T y la
medida de rendimiento P, si su desempeño en tareas en T, medido por P, mejora con la
experiencia E. "

Ejemplo: jugar damas.

E = la experiencia de jugar muchos juegos de damas

T = la tarea de jugar damas.

P = la probabilidad de que el programa gane el próximo juego.

En general, cualquier problema de aprendizaje de máquina se puede asignar a una de dos


clasificaciones amplias:

Aprendizaje supervisado y aprendizaje no supervisado.

Aprendizaje supervisado
Transcripción interactiva

Buscar transcripción

Inglés

0:00

En este video voy a definir cuál es probablemente el tipo de máquina más común problema de
aprendizaje, que es aprendizaje supervisado. Definiré el aprendizaje supervisado más
formalmente después, pero probablemente sea mejor explicarlo o comenzar con un ejemplo
de lo que es y haremos la definición formal más tarde. Digamos que quieres predecir los
precios de la vivienda. Hace un tiempo, un estudiante recopiló conjuntos de datos del Instituto
de Portland Oregon. Digamos que trazas un conjunto de datos y parece esta. Aquí en el eje
horizontal, el tamaño de diferentes casas en pies cuadrados, y en el eje vertical, el precio de
diferentes casas en miles de dólares. Asi que. Teniendo en cuenta esta información, digamos
que usted tiene un amigo que posee una casa que es, digamos 750 pies cuadrados y con la
esperanza de vender la casa y quieren saber cuánto pueden llegar a la casa. Entonces, ¿cómo
puede ayudarte el algoritmo de aprendizaje? Una cosa es aprender algoritmo podría ser capaz
de hacer una línea recta a través de los datos o para adaptarse a un línea recta a los datos y, en
base a eso, parece que tal vez la casa puede ser vendido por tal vez alrededor de $ 150,000.
Pero tal vez este no sea el único algoritmo de aprendizaje que puedas utilizar. Puede haber
uno mejor. Por ejemplo, en lugar de enviar una escalera línea a los datos, podemos decidir que
es mejor caber un cuadrático función o un polinomio de segundo orden para estos datos. Y si
haces eso, y haces una predicción aquí, entonces parece que, bueno, tal vez podamos vender
la casa por más cerca de $ 200,000. Una de las cosas de las que hablaremos más adelante es
cómo elegir y cómo decide si desea ajustar una línea recta a los datos o si desea ajustar el
función cuadrática a los datos y no hay elección justa lo que uno le da a su amigo, la mejor
casa para vender. Pero cada uno de estos sería un buen ejemplo de algoritmo de aprendizaje.
Este es un ejemplo de algoritmo de aprendizaje supervisado. Y el término aprendizaje
supervisado se refiere al hecho de que le dimos al algoritmo un conjunto de datos en el que se
dieron las "respuestas correctas". Es decir, le dimos un conjunto de datos de casas en las que
para cada ejemplo en este conjunto de datos, le dijimos cuál es el derecho precio, entonces,
¿cuál es el precio real que, esa casa vendida y el lanzamiento de la Algoritmo fue simplemente
producir más de estas respuestas correctas, como para este nuevo casa, ya sabes, que su
amigo puede estar tratando de vender. Para definir con un poco más terminología esto
también se llama un problema de regresión y por regresión problema, quiero decir que
estamos tratando de predecir un resultado de valor continuo. A saber, el precio. Entonces,
técnicamente, creo que los precios pueden redondearse al centavo más cercano. Así que tal
vez los precios son en realidad valores discretos, pero generalmente pensamos en el precio de
una casa como un número real, como un valor escalar, como un número de valor continuo y el
término La regresión se refiere al hecho de que estamos tratando de predecir el tipo de
continuo atributo de valores Aquí hay otro ejemplo de aprendizaje supervisado, algunos
amigos y en realidad estaba trabajando en esto antes. Veamos que quieres ver registros
médicos e intentar predecir si un cáncer de seno es maligno o benigno. Si alguien descubre un
tumor de mama, un bulto en el pecho, un tumor maligno es tumor que es dañino y peligroso y
un tumor benigno es un tumor que es inofensivo. Entonces, obviamente, la gente se preocupa
mucho por esto. Veamos un conjunto de datos recopilados y supongamos en su conjunto de
datos tiene en su eje horizontal el tamaño del tumor y en el eje vertical voy a trazar uno o
cero, sí o no, si estos son o no ejemplos de tumores que hemos visto antes son malignos, que
son uno o cero si no son malignos o benigno Entonces, digamos que nuestro conjunto de datos
se ve así cuando vimos un tumor de este tamaño que resultó ser benigno. Uno de este
tamaño, uno de este tamaño. Y así. Y lamentablemente también vimos algunos tumores
malignos, uno de ese tamaño, uno de esos tamaño, uno de ese tamaño ... Así sucesivamente.
Entonces este ejemplo ... Tengo cinco ejemplos de benignos tumores que se muestran aquí, y
cinco ejemplos de tumores malignos que se muestran con una vertical valor de eje de uno. Y
digamos que tenemos un amigo que trágicamente tiene un seno tumor, y digamos que su
tamaño de tumor de mama es tal vez en algún lugar alrededor de este valor. los pregunta de
aprendizaje automático es, ¿puede estimar cuál es la probabilidad, qué es la posibilidad de que
un tumor sea maligno versus benigno? Para introducir un poco más terminología este es un
ejemplo de un problema de clasificación. El termino clasificación se refiere al hecho de que
aquí estamos tratando de predecir un discreto valor de salida: cero o uno, maligno o benigno.
Y resulta que en problemas de clasificación a veces puede tener más de dos valores para los
dos valores posibles para la salida. Como ejemplo concreto, tal vez haya tres tipos de cáncer de
seno y, por lo tanto, puede tratar de predecir el valor discreto de cero, uno, dos o tres con cero
siendo benigno. Tumor benigno, por lo que no hay cáncer Y uno puede significa, escriba un
cáncer, como que tiene tres tipos de cáncer, cualquiera que sea el tipo uno medio. Y dos
pueden significar un segundo tipo de cáncer, un tres puede significar un tercer tipo de cáncer
cáncer. Pero esto también sería un problema de clasificación, porque este otro conjunto de
valores discretos de salida correspondiente a, ya sabes, sin cáncer o tipo de cáncer uno, o
cáncer tipo dos, o cáncer tipo tres. En problemas de clasificación hay Otra forma de trazar
estos datos. Déjame mostrarte lo que quiero decir. Déjame usar un poco diferente conjunto de
símbolos para trazar estos datos. Entonces, si el tamaño del tumor va a ser el atributo que voy
a utilizar para predecir malignidad o benignidad, también puedo dibujar mis datos como este
Voy a usar diferentes símbolos para denotar mi benignidad y maligno, o mis ejemplos
negativos y positivos. Entonces, en lugar de dibujar cruces, Ahora voy a dibujar O para los
tumores benignos. Al igual que. Y voy a mantener usando X para denotar mis tumores
malignos. ¿Bueno? Espero que esto empiece a hacer sentido. Todo lo que hice fue tomar, ya
sabes, estos, mi conjunto de datos en la parte superior y yo solo mapeado. A esta línea real
como tal. Y comenzó a usar diferentes símbolos, círculos y cruces, para denotar ejemplos
malignos versus benignos. Ahora, en este ejemplo, usamos solo una característica o un
atributo, principalmente, el tamaño del tumor en orden para predecir si el tumor es maligno o
benigno. En otro aprendizaje automático problemas cuando tenemos más de una
característica, más de un atributo. Aquí está un ejemplo. Digamos que en lugar de
simplemente conocer el tamaño del tumor, sabemos que tanto edad de los pacientes y
tamaño del tumor En ese caso, tal vez su conjunto de datos se verá como este en el que puedo
tener un conjunto de pacientes con esas edades y que el tamaño del tumor y se ven así Y un
grupo diferente de pacientes, se ven un poco diferentes, cuyos tumores resultan ser malignos,
como se denota por las cruces. Entonces, digamos que tener un amigo que trágicamente tiene
un tumor Y tal vez, el tamaño de su tumor y la edad cae por ahí. Entonces, dado un conjunto
de datos como este, ¿cuál es el algoritmo de aprendizaje? podría hacer es tirar la línea recta a
través de los datos para tratar de separar los tumores malignos de los benignos y, por lo que el
algoritmo de aprendizaje puede decidir lanzar la línea recta así para separar las dos clases de
tumores. Y. Ya sabes, con esto, con suerte puedes decidir que el tumor de tu amigo es más
probable si está allí, que con suerte su algoritmo de aprendizaje dirá que el tumor de tu amigo
cae en este lado benigno y por lo tanto es más probablemente sea benigno que maligno En
este ejemplo, teníamos dos características, a saber, la edad del paciente y el tamaño del
tumor. En otros problemas de aprendizaje automático a menudo tendremos más funciones, y
mis amigos que trabajan en este problema, de hecho, use otras características como estas, que
es el espesor de los grupos, el espesor de los grupos el tumor de mama Uniformidad del
tamaño celular del tumor Uniformidad de la forma de la celda de el tumor, etc., y otras
características también. Y resulta uno de los intereses-, la mayoría de los algoritmos de
aprendizaje interesantes que veremos en esta clase es un aprendizaje algoritmo que puede
manejar, no solo dos o tres o cinco características, sino un infinito numero de caracteristicas
En esta diapositiva, he enumerado un total de cinco características diferentes. Derecha, dos en
los ejes y tres más aquí arriba. Pero resulta que para algunos aprendiendo problemas, lo que
realmente quiere es no usar, como, tres o cinco características. Pero en su lugar, desea utilizar
un número infinito de características, un número infinito de atributos, para que su algoritmo
de aprendizaje tenga muchos atributos o características o señales con las cuales hacer esas
predicciones. Entonces, ¿cómo lidias con un infinita cantidad de funciones. ¿Cómo se
almacena un número infinito de cosas en la computadora cuando su computadora se quedará
sin memoria. Eso resulta que cuando hablamos de un algoritmo llamado Vector de Soporte
Machine, habrá un truco matemático ordenado que permitirá a una computadora lidiar con
infinitas funciones Imagina que no solo escribí dos características aquí y tres características a la
derecha. Pero imagina que escribí una lista infinitamente larga, solo seguí escribiendo más y
más y más características. Como una lista infinitamente larga de caracteristicas. Resulta que
podremos encontrar un algoritmo que pueda manejar ese. Entonces, solo para recapitular. En
esta clase hablaremos de supervisión aprendizaje. Y la idea es que, en el aprendizaje
supervisado, en cada ejemplo en nuestro conjunto de datos, se nos dice cuál es la "respuesta
correcta" que tendríamos Me gustó bastante que los algoritmos hayan predicho en ese
ejemplo. Tal como el precio de la casa, o si un tumor es maligno o benigno. También hablamos
sobre el problema de regresión Y por regresión, eso significa que nuestro objetivo es predecir
salida de valor continuo. Y hablamos sobre el problema de la clasificación, donde el objetivo es
predecir un resultado de valor discreto. Solo una breve pregunta de recapitulación:
Supongamos que está ejecutando una empresa y desea desarrollar algoritmos de aprendizaje
para abordar cada uno de dos problemas. En el primer problema, tiene un gran inventario de
artículos idénticos. Entonces imagina que tienes miles de copias de algunos idénticos artículos
para vender y desea predecir cuántos de estos artículos vende dentro del los próximos tres
meses. En el segundo problema, problema dos, quisieras-- tienes muchos usuarios y desea
escribir software para examinar a cada individuo de su las cuentas del cliente, por lo que cada
una de las cuentas de sus clientes; y para cada cuenta, decidir si la cuenta ha sido pirateada o
comprometida. Entonces, para cada uno de estos problemas, deberían tratarse como un
problema de clasificación, o como un problema de regresión? Cuando el video hace una pausa,
usa el mouse para seleccionar el que de estas cuatro opciones a la izquierda, piensas que es la
respuesta correcta. Así que con suerte tienes que esta es la respuesta. Para el problema uno,
lo trataría como un problema de regresión, porque si tengo, ya sabes, miles de artículos,
bueno, lo haría probablemente solo trate esto como un valor real, como un valor continuo. Y
trate, por lo tanto, el número de artículos que vendo, como un valor continuo. Y para el
segundo problema, lo trataría como un problema de clasificación, porque podría digamos,
establezca el valor que quiero predecir con cero, para indicar que la cuenta no ha sido
hackeado Y configure el valor uno para denotar una cuenta que ha sido pirateada. Por lo que
sólo como, ya sabes, el cáncer de mama, es cero es benigno, uno es maligno. Asique podría
establecer esto sea cero o uno dependiendo de si ha sido pirateado, y tener un algoritmo
intenta predecir cada uno de estos dos valores discretos. Y porque hay un pequeño número de
valores discretos, por lo tanto, lo trataría como una clasificación problema. Entonces, eso es
todo para el aprendizaje supervisado y en el próximo video hablaré sobre el aprendizaje no
supervisado, que es la otra categoría principal de algoritmos de aprendizaje.

Aprendizaje supervisado
En el aprendizaje supervisado, se nos da un conjunto de datos y ya sabemos cómo
debería ser nuestra salida correcta, teniendo la idea de que existe una relación entre la
entrada y la salida.

Los problemas de aprendizaje supervisado se clasifican en problemas de "regresión" y


"clasificación". En un problema de regresión, estamos tratando de predecir resultados
dentro de un resultado continuo, lo que significa que estamos tratando de asignar variables
de entrada a alguna función continua. En un problema de clasificación, en cambio,
estamos tratando de predecir los resultados en un resultado discreto. En otras palabras,
estamos tratando de asignar variables de entrada en categorías discretas.

Ejemplo 1:

Dada la información sobre el tamaño de las casas en el mercado inmobiliario, trate de


predecir su precio. El precio en función del tamaño es un resultado continuo, por lo que
este es un problema de regresión.

Podríamos convertir este ejemplo en un problema de clasificación al hacer nuestra salida


sobre si la casa "se vende por más o menos que el precio solicitado". Aquí estamos
clasificando las casas según el precio en dos categorías discretas.

Ejemplo 2 :
(a) Regresión - Dada la imagen de una persona, tenemos que predecir su edad sobre la
base de la imagen dada

(b) Clasificación: dado un paciente con un tumor, debemos predecir si el tumor es maligno
o benigno.

Aprendizaje sin supervisión

0:00

En este video, hablaremos sobre el segundo tipo principal de máquina problema de


aprendizaje, llamado Aprendizaje no supervisado.

0:06

En el último video, hablamos sobre el aprendizaje supervisado. En ese momento, recuperar


conjuntos de datos que se ven así, donde cada ejemplo fue etiquetado ya sea como un
ejemplo positivo o negativo, si fue un tumor benigno o maligno

0:20

Entonces para cada ejemplo en Supervisado Aprendiendo, nos dijeron explícitamente qué es la
llamada respuesta correcta, ya sea benigno o maligno En el aprendizaje no supervisado, nos
dan datos que se ven diferentes que los datos que se parecen esto que no tiene cualquier
etiqueta o que todo tiene la misma etiqueta o realmente no tiene etiquetas.

0:39

Así que nos dieron el conjunto de datos y no nos dicen qué hacer con eso y no estamos dijo lo
que es cada punto de datos. En cambio, nos acaban de decir, aquí hay un conjunto de datos.
¿Puedes encontrar alguna estructura en los datos? Dado este conjunto de datos, una
Algoritmo de Aprendizaje No Supervisado podría decidir que los datos viven en dos grupos
diferentes. Y entonces hay un grupo

0:59

y hay un grupo diferente

1:01

Y sí, el algoritmo de Aprendizaje Supervisado puede divide estos datos en estos dos grupos
separados.

1:06

Entonces esto se llama algoritmo de agrupamiento. Y esto resulta ser utilizado en muchos
lugares.

1:11
Un ejemplo donde la agrupación se usa está en Google Noticias y si no tienes visto esto antes,
en realidad puedes ve a esta URL news.google.com echar un vistazo. Lo que Google News hace
es todos los días va y mira decenas de miles o cientos de miles de nuevas historias en el web y
los agrupa en noticias cohesivas.

1:30

Por ejemplo, veamos aquí.

1:33

Las URL aquí vinculadas a diferentes noticias sobre la historia de BP Oil Well.

1:41

Entonces, hagamos clic en una de estas URL y lo haremos haga clic en una de estas URL. Lo que
llegaré es una página web como esta. Aquí hay un Wall Street Artículo de revista sobre, ya
sabes, el BP Historias de derrames de pozos petroleros de "BP mata a Macondo", que es un
nombre del derrame y si haga clic en una URL diferente

2:00

de ese grupo, entonces puede obtener la historia diferente. Aquí está la historia de CNN sobre
un juego, el derrame de petróleo de BP,

2:07

y si haces clic todavía un tercer enlace, entonces puede obtener una historia diferente. Aquí
está la historia del Guardian del Reino Unido sobre el derrame de petróleo de BP.

2:16

Entonces, ¿qué ha hecho Google News? es buscar decenas de miles de historias de noticias y
agruparlos automáticamente. Entonces, las noticias que son todas sobre el mismo tema se
muestran juntos. Resulta que algoritmos de agrupamiento y aprendizaje no supervisado los
algoritmos se usan en muchos otros problemas también.

2:35

Aquí hay uno sobre la comprensión de la genómica.

2:38

Aquí hay un ejemplo de datos de microarrays de ADN. La idea está puesta un grupo de
diferentes individuos y para cada uno de ellos, usted mide cuánto tienen o no tienen cierto
gen. Técnicamente se mide la cantidad de ciertos genes que se expresan. Entonces estos
colores, rojo, verde, gris y así sucesivamente, ellos mostrar el grado en que diferentes
personas hacen o no tiene un gen específico

3:02
Y lo que puedes hacer es entonces ejecutar un algoritmo de agrupamiento para agrupar
individuos en diferentes categorías o en diferentes tipos de personas.

3:10

Entonces este es el Aprendizaje No Supervisado porque no estamos diciendo el algoritmo por


adelantado que estas son personas de tipo 1, esas son personas tipo 2, esas son personas tipo
3 y por lo tanto y, en cambio, lo que decían es, sí, aquí hay un montón de datos. No sé qué hay
en esta información. No sé quién es y qué tipo. Ni siquiera sé qué es lo diferente tipos de
personas son, pero pueden usted encuentra automáticamente la estructura en los datos de
usted automáticamente agrupar a los individuos en estos tipos que no sé de antemano?
Porque no estamos dando el algoritmo la respuesta correcta para el ejemplos en mis datos
establecer, este es el aprendizaje no supervisado.

3:44

El Aprendizaje no supervisado o la agrupación en clúster se usa para muchas otras


aplicaciones.

3:48

Se usa para organizar grandes grupos de computadoras.

3:51

Tenía algunos amigos mirando grandes centros de datos, eso es grandes grupos de
computadoras y tratando para descubrir qué máquinas tienden a trabajar juntos y si puedes
juntar esas máquinas, puede hacer que su centro de datos funcione de manera más eficiente.

4:04

Esta segunda aplicación es sobre análisis de redes sociales.

4:07

Así que, dado el conocimiento sobre qué amigos le envías el correo electrónico más o dado a
tus amigos de Facebook o sus círculos de Google+, pueden identificamos automáticamente
cuáles son grupos cohesivos de amigos, también que son grupos de personas que todos se
conocen?

4:22

Segmentación de mercado.

4:24

Muchas empresas tienen enormes bases de datos de información del cliente. Entonces,
¿puedes mirar esto? conjunto de datos del cliente y automáticamente descubrir segmentos de
mercado y automáticamente

4:33
agrupe a sus clientes en diferentes segmentos de mercado para que puedes automáticamente
y más Vender o comercializar eficientemente sus diferentes segmentos de mercado juntos?

4:44

Nuevamente, este es el Aprendizaje No Supervisado porque tenemos todo esto datos del
cliente, pero nosotros no saber de antemano cuáles son los segmentos de mercado y para los
clientes en nuestros datos establecer, ya sabes, no sabemos en avanzar quién está en
segmento de mercado uno, que es en el segmento de mercado dos, y así sucesivamente. Pero
tenemos que dejar que el algoritmo descubra todo esto solo a partir de los datos.

5:01

Finalmente, resulta que Sin supervisión El aprendizaje también se usa para análisis de datos
sorprendentemente astronómico y estos algoritmos de agrupamiento dan Teorías útiles
sorprendentemente interesantes de cómo se forman las galaxias. Todos estos son ejemplos de
agrupamiento, que es solo un tipo de aprendizaje no supervisado. Déjame contarte sobre otro.
Te voy a hablar sobre el problema del cóctel.

5:26

Entonces, has estado en cócteles antes, ¿verdad? Bueno, puedes imaginar que hay un fiesta,
sala llena de gente, todo sentados, hablando en el mismo tiempo y hay todas estas voces
superpuestas porque todo el mundo está hablando al mismo tiempo, y es casi difícil escuchar a
la persona frente a ti. Entonces tal vez en un cóctel con dos personas,

5:45

dos personas hablando al mismo tiempo, y es un tanto pequeño cóctel. Y vamos a poner dos
micrófonos en la habitación tan hay micrófonos, y porque estos micrófonos están en dos
diferentes distancias de la altavoces, cada registro de micrófono una combinación diferente de
estas dos voces de altavoz.

6:05

Tal vez el orador uno es un poco más fuerte en el micrófono uno y tal vez el altavoz dos es un
un poco más fuerte en el micrófono 2 porque los 2 micrófonos son en diferentes posiciones
relativas a los 2 parlantes, pero cada el micrófono causaría una superposición combinación de
las voces de ambos oradores.

6:23

Así que aquí hay una grabación real

6:26

de dos hablantes grabados por un investigador. Déjame jugar para ti primero, cómo suena el
primer micrófono One (uno), two (dos), tres (tres), cuatro (cuatro), cinco (cinco), six (seis),
seven (siete), eight (ocho), nine (nueve), ten (y diez).
6:41

Muy bien, tal vez no el cóctel más interesante fiesta, hay dos personas contando de uno a diez
en dos idiomas, pero ya sabes Lo que acabas de escuchar fue el primera grabación de
micrófono, aquí está la segunda grabación.

6:57

Uno (one), dos (two), tres (three), cuatro (four), cinco (five), seis (six), siete (seven), ocho
(eight), nueve (nine) y diez (ten). Entonces podemos hacer, es tomar estos dos grabadores de
micrófono y dan a un algoritmo de aprendizaje no supervisado llamado el algoritmo del cóctel,
y decir el algoritmo - encuentra estructura en esta información para ti. Y lo que hará el
algoritmo es escuchar estos grabaciones de audio y decir, usted Sé que suena como el dos
grabaciones de audio están siendo sumados o que han sido resumidos para producir estas
grabaciones que teníamos. Por otra parte, lo que el cóctel algoritmo hará es por separado
estas dos fuentes de audio que se estaban agregando o siendo sumados para formar otros
grabaciones y, de hecho, aquí está la primera salida del algoritmo del cóctel.

7:39

Uno dos tres CUATRO, cinco seis SIETE OCHO NUEVE DIEZ.

7:47

Entonces, separé el inglés voz en una de las grabaciones.

7:52

Y aquí está el segundo. Uno, dos, tres, quatro, cinco, seis, siete, ocho, nueve y diez. No está
mal, para darte

8:03

un ejemplo más, aquí hay otro grabación de otra situación similar, aquí está el primer
micrófono: uno, dos, tres, cuatro, cinco, seis, siete ocho NUEVE DIEZ.

8:16

De acuerdo, el pobre se fue casa de la fiesta y ahora está sentado en una habitación hablando
solo con su radio.

8:23

Aquí está la segunda grabación de micrófono.

8:28

Uno dos tres CUATRO CINCO SEIS SIETE OCHO NUEVE DIEZ.

8:33
Cuando das estos dos micrófonos grabaciones al mismo algoritmo, lo que hace, es otra vez
decir, ya sabes, parece que hay son dos fuentes de audio, y además,

8:42

el álbum dice, aquí está la primera de las fuentes de audio que encontré.

8:47

Uno dos tres CUATRO, cinco seis SIETE OCHO NUEVE DIEZ.

8:54

Entonces eso no fue perfecto, obtuvo la voz, pero También obtuve un poco de la música allí.
Entonces aquí está la segunda salida al algoritmo.

9:10

No está mal, en ese segundo salida logró deshacerse de la voz por completo. Y solo, ya sabes,
limpió la música, se deshizo del recuento del uno al diez.

9:18

Entonces podrías mirar un algoritmo de aprendizaje no supervisado como esto y pregunta


cómo complicado esto es implementar esto, ¿verdad? Parece que para poder ya sabes, crea
esta aplicación, parece gustaría hacer este procesamiento de audio necesita escribir una
tonelada de código o tal vez un enlace en como un montón de bibliotecas de sintetizador de
Java que procesar audio, parece un programa realmente complicado, para hacer este audio,
separando el audio, etc.

9:42

Resulta que el algoritmo, para haz lo que acabas de escuchar, eso se puede hacer con una línea
de código - se muestra aquí.

9:50

Lleva a los investigadores una larga hora de idear esta línea de código. No digo que este sea un
problema fácil, Pero resulta que cuando usa el entorno de programación correcto, muchos
aprendiendo los algoritmos pueden ser programas realmente cortos.

10:03

Entonces esta es también la razón por la cual esta clase vamos a usa el entorno de
programación Octave.

10:08

Octave, es fuente abierta gratuita software, y usando un herramienta como Octave o Matlab,
muchos algoritmos de aprendizaje se vuelven justos unas pocas líneas de código para
implementar. Más adelante en esta clase, solo enseñaré usted un poco sobre cómo usa Octave
y estarás implementando algunos de estos algoritmos en Octave. O si tienes Matlab puedes
usar eso también.

10:27

Resulta que el Silicon Valley, por una gran cantidad de algoritmos de aprendizaje automático,
lo que hacemos es el primer prototipo nuestro software en Octave porque el software en
Octave lo hace increíblemente rápido para implementar estos algoritmos de aprendizaje.

10:38

Aquí cada una de estas funciones como por ejemplo el SVD función que significa singular
descomposición del valor; pero eso gira ser un rutina de álgebra lineal, que está integrada en
Octave.

10:49

Si estabas tratando de hacer esto en C ++ o Java, esto sería muchas muchas líneas de código
que vincula bibliotecas complejas de C ++ o Java. Entonces, puedes implementar esto como C
++ o Java o Python, es solo mucho más complicado hacerlo en esos idiomas.

11:03

Lo que he visto después de haber enseñado aprendizaje automático para casi una década
ahora, es eso, tú aprende mucho más rápido si usa Octave como tu entorno de programación,
y si Usas Octave como tu herramienta de aprendizaje y como su herramienta de prototipado,
dejará aprendes y prototipas los algoritmos de aprendizaje mucho más rápido.

11:22

Y, de hecho, lo que mucha gente hacer en el Silicio grande Las compañías del valle es, de
hecho, uso un algoritmo como Octave para primero prototipo del algoritmo de aprendizaje, y
solo después de haberlo obtenido para trabajar, luego migras a C ++ o Java o lo que sea.
Resulta que al hacerlo cosas de esta manera, a menudo consigue tu algoritmo para trabajar
mucho más rápido que si estuvieras empezando en C ++.

11:44

Entonces, sé que como instructor, llego a di "confía en mí" este "solo un finito número de
veces, pero para aquellos de ustedes que nunca han usado estos Entornos de programación
tipo Octave antes, Voy a preguntarte confiar en mí en este, y di que tú, lo harás, Creo que tu
tiempo, tu desarrollo el tiempo es uno de los recursos más valiosos.

12:04

Y habiendo visto muchos de personas hacen esto, creo usted como un aprendizaje automático
investigador o desarrollador de aprendizaje automático será mucho más productivo si
aprendes a comenzar en prototipo, para comenzar en Octave, en algún otro idioma.
12:17

Finalmente, para envolver arriba de este video, tengo una pregunta de revisión rápida para
usted.

12:24

Hablamos sobre el aprendizaje no supervisado, que es un entorno de aprendizaje donde dar el


algoritmo de una tonelada de datos y solo pregunte para encontrar estructura en los datos
para nosotros. De los siguientes cuatro ejemplos, que unos, cuál de estos cuatro ¿Crees que
sería un algoritmo de aprendizaje no supervisado como opuesto al problema de Aprendizaje
Supervisado. Para cada uno de los cuatro casillas de verificación a la izquierda, comprobar los
que piensas que el aprendizaje no supervisado Algoritmo sería apropiado y luego haz clic en el
botón en la esquina inferior derecha para verificar tu respuesta. Entonces cuando el video
hace una pausa, por favor responde la pregunta en la diapositiva.

13:01

Entonces, con suerte, has recordado el problema de la carpeta de spam. Si tiene datos
etiquetados, saber, con spam y correo electrónico no spam, lo trataríamos como un problema
de aprendizaje supervisado.

13:11

El ejemplo de la historia de noticias, eso es exactamente el ejemplo de Google News que vimos
en este video, vimos cómo puedes usar un algoritmo de agrupamiento para agrupar estos
artículos juntos para que sea el aprendizaje no supervisado.

13:23

El ejemplo de segmentación de mercado I habló un poco antes, tú puede hacer eso como un
problema de aprendizaje no supervisado porque solo voy a obtener mi algoritmo de datos y
preguntar para descubrir segmentos de mercado de forma automática.

13:35

Y el último ejemplo, diabetes, bueno, eso es realmente como nuestro ejemplo de cáncer de
mama del último video. Solo en lugar de, ya sabes, tumores cancerosos buenos y malos o
tumores benignos o malignos que en cambio, tiene diabetes o no y así lo haremos usar eso
como supervisado, vamos a resolver eso como un problema de aprendizaje supervisado al
igual que lo hicimos para los datos del tumor de mama.

13:58

Entonces, eso es todo sin supervisión Aprendiendo y en el el próximo video, profundizaremos


más en algoritmos de aprendizaje específicos y comienza a hablar cómo funcionan estos
algoritmos y cómo podemos, cómo puedes implementarlos.

Aprendizaje sin supervisión


El aprendizaje sin supervisión nos permite abordar problemas con poca o ninguna idea de
cómo deberían ser nuestros resultados. Podemos derivar la estructura de los datos donde
no necesariamente conocemos el efecto de las variables.

Podemos derivar esta estructura al agrupar los datos en función de las relaciones entre las
variables en los datos.

Con el aprendizaje no supervisado no hay comentarios basados en los resultados de


predicción.

Ejemplo:

Agrupamiento: tome una colección de 1,000,000 de genes diferentes, y encuentre una


forma de agrupar automáticamente estos genes en grupos que de alguna manera son
similares o están relacionados por diferentes variables, como la esperanza de vida, la
ubicación, los roles, etc.

No agrupado: el "Algoritmo del cóctel", le permite encontrar la estructura en un entorno


caótico. (es decir, identificar las voces individuales y la música de una red de sonidos en
una fiesta de cóctel ).

También podría gustarte