Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Transcripción interactiva
Buscar transcripción
Inglés
0:00
0:31
Tom Mitchell proporciona una definición más moderna: "Se dice que un programa de
computadora aprende de la experiencia E con respecto a una clase de tareas T y la
medida de rendimiento P, si su desempeño en tareas en T, medido por P, mejora con la
experiencia E. "
Aprendizaje supervisado
Transcripción interactiva
Buscar transcripción
Inglés
0:00
En este video voy a definir cuál es probablemente el tipo de máquina más común problema de
aprendizaje, que es aprendizaje supervisado. Definiré el aprendizaje supervisado más
formalmente después, pero probablemente sea mejor explicarlo o comenzar con un ejemplo
de lo que es y haremos la definición formal más tarde. Digamos que quieres predecir los
precios de la vivienda. Hace un tiempo, un estudiante recopiló conjuntos de datos del Instituto
de Portland Oregon. Digamos que trazas un conjunto de datos y parece esta. Aquí en el eje
horizontal, el tamaño de diferentes casas en pies cuadrados, y en el eje vertical, el precio de
diferentes casas en miles de dólares. Asi que. Teniendo en cuenta esta información, digamos
que usted tiene un amigo que posee una casa que es, digamos 750 pies cuadrados y con la
esperanza de vender la casa y quieren saber cuánto pueden llegar a la casa. Entonces, ¿cómo
puede ayudarte el algoritmo de aprendizaje? Una cosa es aprender algoritmo podría ser capaz
de hacer una línea recta a través de los datos o para adaptarse a un línea recta a los datos y, en
base a eso, parece que tal vez la casa puede ser vendido por tal vez alrededor de $ 150,000.
Pero tal vez este no sea el único algoritmo de aprendizaje que puedas utilizar. Puede haber
uno mejor. Por ejemplo, en lugar de enviar una escalera línea a los datos, podemos decidir que
es mejor caber un cuadrático función o un polinomio de segundo orden para estos datos. Y si
haces eso, y haces una predicción aquí, entonces parece que, bueno, tal vez podamos vender
la casa por más cerca de $ 200,000. Una de las cosas de las que hablaremos más adelante es
cómo elegir y cómo decide si desea ajustar una línea recta a los datos o si desea ajustar el
función cuadrática a los datos y no hay elección justa lo que uno le da a su amigo, la mejor
casa para vender. Pero cada uno de estos sería un buen ejemplo de algoritmo de aprendizaje.
Este es un ejemplo de algoritmo de aprendizaje supervisado. Y el término aprendizaje
supervisado se refiere al hecho de que le dimos al algoritmo un conjunto de datos en el que se
dieron las "respuestas correctas". Es decir, le dimos un conjunto de datos de casas en las que
para cada ejemplo en este conjunto de datos, le dijimos cuál es el derecho precio, entonces,
¿cuál es el precio real que, esa casa vendida y el lanzamiento de la Algoritmo fue simplemente
producir más de estas respuestas correctas, como para este nuevo casa, ya sabes, que su
amigo puede estar tratando de vender. Para definir con un poco más terminología esto
también se llama un problema de regresión y por regresión problema, quiero decir que
estamos tratando de predecir un resultado de valor continuo. A saber, el precio. Entonces,
técnicamente, creo que los precios pueden redondearse al centavo más cercano. Así que tal
vez los precios son en realidad valores discretos, pero generalmente pensamos en el precio de
una casa como un número real, como un valor escalar, como un número de valor continuo y el
término La regresión se refiere al hecho de que estamos tratando de predecir el tipo de
continuo atributo de valores Aquí hay otro ejemplo de aprendizaje supervisado, algunos
amigos y en realidad estaba trabajando en esto antes. Veamos que quieres ver registros
médicos e intentar predecir si un cáncer de seno es maligno o benigno. Si alguien descubre un
tumor de mama, un bulto en el pecho, un tumor maligno es tumor que es dañino y peligroso y
un tumor benigno es un tumor que es inofensivo. Entonces, obviamente, la gente se preocupa
mucho por esto. Veamos un conjunto de datos recopilados y supongamos en su conjunto de
datos tiene en su eje horizontal el tamaño del tumor y en el eje vertical voy a trazar uno o
cero, sí o no, si estos son o no ejemplos de tumores que hemos visto antes son malignos, que
son uno o cero si no son malignos o benigno Entonces, digamos que nuestro conjunto de datos
se ve así cuando vimos un tumor de este tamaño que resultó ser benigno. Uno de este
tamaño, uno de este tamaño. Y así. Y lamentablemente también vimos algunos tumores
malignos, uno de ese tamaño, uno de esos tamaño, uno de ese tamaño ... Así sucesivamente.
Entonces este ejemplo ... Tengo cinco ejemplos de benignos tumores que se muestran aquí, y
cinco ejemplos de tumores malignos que se muestran con una vertical valor de eje de uno. Y
digamos que tenemos un amigo que trágicamente tiene un seno tumor, y digamos que su
tamaño de tumor de mama es tal vez en algún lugar alrededor de este valor. los pregunta de
aprendizaje automático es, ¿puede estimar cuál es la probabilidad, qué es la posibilidad de que
un tumor sea maligno versus benigno? Para introducir un poco más terminología este es un
ejemplo de un problema de clasificación. El termino clasificación se refiere al hecho de que
aquí estamos tratando de predecir un discreto valor de salida: cero o uno, maligno o benigno.
Y resulta que en problemas de clasificación a veces puede tener más de dos valores para los
dos valores posibles para la salida. Como ejemplo concreto, tal vez haya tres tipos de cáncer de
seno y, por lo tanto, puede tratar de predecir el valor discreto de cero, uno, dos o tres con cero
siendo benigno. Tumor benigno, por lo que no hay cáncer Y uno puede significa, escriba un
cáncer, como que tiene tres tipos de cáncer, cualquiera que sea el tipo uno medio. Y dos
pueden significar un segundo tipo de cáncer, un tres puede significar un tercer tipo de cáncer
cáncer. Pero esto también sería un problema de clasificación, porque este otro conjunto de
valores discretos de salida correspondiente a, ya sabes, sin cáncer o tipo de cáncer uno, o
cáncer tipo dos, o cáncer tipo tres. En problemas de clasificación hay Otra forma de trazar
estos datos. Déjame mostrarte lo que quiero decir. Déjame usar un poco diferente conjunto de
símbolos para trazar estos datos. Entonces, si el tamaño del tumor va a ser el atributo que voy
a utilizar para predecir malignidad o benignidad, también puedo dibujar mis datos como este
Voy a usar diferentes símbolos para denotar mi benignidad y maligno, o mis ejemplos
negativos y positivos. Entonces, en lugar de dibujar cruces, Ahora voy a dibujar O para los
tumores benignos. Al igual que. Y voy a mantener usando X para denotar mis tumores
malignos. ¿Bueno? Espero que esto empiece a hacer sentido. Todo lo que hice fue tomar, ya
sabes, estos, mi conjunto de datos en la parte superior y yo solo mapeado. A esta línea real
como tal. Y comenzó a usar diferentes símbolos, círculos y cruces, para denotar ejemplos
malignos versus benignos. Ahora, en este ejemplo, usamos solo una característica o un
atributo, principalmente, el tamaño del tumor en orden para predecir si el tumor es maligno o
benigno. En otro aprendizaje automático problemas cuando tenemos más de una
característica, más de un atributo. Aquí está un ejemplo. Digamos que en lugar de
simplemente conocer el tamaño del tumor, sabemos que tanto edad de los pacientes y
tamaño del tumor En ese caso, tal vez su conjunto de datos se verá como este en el que puedo
tener un conjunto de pacientes con esas edades y que el tamaño del tumor y se ven así Y un
grupo diferente de pacientes, se ven un poco diferentes, cuyos tumores resultan ser malignos,
como se denota por las cruces. Entonces, digamos que tener un amigo que trágicamente tiene
un tumor Y tal vez, el tamaño de su tumor y la edad cae por ahí. Entonces, dado un conjunto
de datos como este, ¿cuál es el algoritmo de aprendizaje? podría hacer es tirar la línea recta a
través de los datos para tratar de separar los tumores malignos de los benignos y, por lo que el
algoritmo de aprendizaje puede decidir lanzar la línea recta así para separar las dos clases de
tumores. Y. Ya sabes, con esto, con suerte puedes decidir que el tumor de tu amigo es más
probable si está allí, que con suerte su algoritmo de aprendizaje dirá que el tumor de tu amigo
cae en este lado benigno y por lo tanto es más probablemente sea benigno que maligno En
este ejemplo, teníamos dos características, a saber, la edad del paciente y el tamaño del
tumor. En otros problemas de aprendizaje automático a menudo tendremos más funciones, y
mis amigos que trabajan en este problema, de hecho, use otras características como estas, que
es el espesor de los grupos, el espesor de los grupos el tumor de mama Uniformidad del
tamaño celular del tumor Uniformidad de la forma de la celda de el tumor, etc., y otras
características también. Y resulta uno de los intereses-, la mayoría de los algoritmos de
aprendizaje interesantes que veremos en esta clase es un aprendizaje algoritmo que puede
manejar, no solo dos o tres o cinco características, sino un infinito numero de caracteristicas
En esta diapositiva, he enumerado un total de cinco características diferentes. Derecha, dos en
los ejes y tres más aquí arriba. Pero resulta que para algunos aprendiendo problemas, lo que
realmente quiere es no usar, como, tres o cinco características. Pero en su lugar, desea utilizar
un número infinito de características, un número infinito de atributos, para que su algoritmo
de aprendizaje tenga muchos atributos o características o señales con las cuales hacer esas
predicciones. Entonces, ¿cómo lidias con un infinita cantidad de funciones. ¿Cómo se
almacena un número infinito de cosas en la computadora cuando su computadora se quedará
sin memoria. Eso resulta que cuando hablamos de un algoritmo llamado Vector de Soporte
Machine, habrá un truco matemático ordenado que permitirá a una computadora lidiar con
infinitas funciones Imagina que no solo escribí dos características aquí y tres características a la
derecha. Pero imagina que escribí una lista infinitamente larga, solo seguí escribiendo más y
más y más características. Como una lista infinitamente larga de caracteristicas. Resulta que
podremos encontrar un algoritmo que pueda manejar ese. Entonces, solo para recapitular. En
esta clase hablaremos de supervisión aprendizaje. Y la idea es que, en el aprendizaje
supervisado, en cada ejemplo en nuestro conjunto de datos, se nos dice cuál es la "respuesta
correcta" que tendríamos Me gustó bastante que los algoritmos hayan predicho en ese
ejemplo. Tal como el precio de la casa, o si un tumor es maligno o benigno. También hablamos
sobre el problema de regresión Y por regresión, eso significa que nuestro objetivo es predecir
salida de valor continuo. Y hablamos sobre el problema de la clasificación, donde el objetivo es
predecir un resultado de valor discreto. Solo una breve pregunta de recapitulación:
Supongamos que está ejecutando una empresa y desea desarrollar algoritmos de aprendizaje
para abordar cada uno de dos problemas. En el primer problema, tiene un gran inventario de
artículos idénticos. Entonces imagina que tienes miles de copias de algunos idénticos artículos
para vender y desea predecir cuántos de estos artículos vende dentro del los próximos tres
meses. En el segundo problema, problema dos, quisieras-- tienes muchos usuarios y desea
escribir software para examinar a cada individuo de su las cuentas del cliente, por lo que cada
una de las cuentas de sus clientes; y para cada cuenta, decidir si la cuenta ha sido pirateada o
comprometida. Entonces, para cada uno de estos problemas, deberían tratarse como un
problema de clasificación, o como un problema de regresión? Cuando el video hace una pausa,
usa el mouse para seleccionar el que de estas cuatro opciones a la izquierda, piensas que es la
respuesta correcta. Así que con suerte tienes que esta es la respuesta. Para el problema uno,
lo trataría como un problema de regresión, porque si tengo, ya sabes, miles de artículos,
bueno, lo haría probablemente solo trate esto como un valor real, como un valor continuo. Y
trate, por lo tanto, el número de artículos que vendo, como un valor continuo. Y para el
segundo problema, lo trataría como un problema de clasificación, porque podría digamos,
establezca el valor que quiero predecir con cero, para indicar que la cuenta no ha sido
hackeado Y configure el valor uno para denotar una cuenta que ha sido pirateada. Por lo que
sólo como, ya sabes, el cáncer de mama, es cero es benigno, uno es maligno. Asique podría
establecer esto sea cero o uno dependiendo de si ha sido pirateado, y tener un algoritmo
intenta predecir cada uno de estos dos valores discretos. Y porque hay un pequeño número de
valores discretos, por lo tanto, lo trataría como una clasificación problema. Entonces, eso es
todo para el aprendizaje supervisado y en el próximo video hablaré sobre el aprendizaje no
supervisado, que es la otra categoría principal de algoritmos de aprendizaje.
Aprendizaje supervisado
En el aprendizaje supervisado, se nos da un conjunto de datos y ya sabemos cómo
debería ser nuestra salida correcta, teniendo la idea de que existe una relación entre la
entrada y la salida.
Ejemplo 1:
Ejemplo 2 :
(a) Regresión - Dada la imagen de una persona, tenemos que predecir su edad sobre la
base de la imagen dada
(b) Clasificación: dado un paciente con un tumor, debemos predecir si el tumor es maligno
o benigno.
0:00
0:06
0:20
Entonces para cada ejemplo en Supervisado Aprendiendo, nos dijeron explícitamente qué es la
llamada respuesta correcta, ya sea benigno o maligno En el aprendizaje no supervisado, nos
dan datos que se ven diferentes que los datos que se parecen esto que no tiene cualquier
etiqueta o que todo tiene la misma etiqueta o realmente no tiene etiquetas.
0:39
Así que nos dieron el conjunto de datos y no nos dicen qué hacer con eso y no estamos dijo lo
que es cada punto de datos. En cambio, nos acaban de decir, aquí hay un conjunto de datos.
¿Puedes encontrar alguna estructura en los datos? Dado este conjunto de datos, una
Algoritmo de Aprendizaje No Supervisado podría decidir que los datos viven en dos grupos
diferentes. Y entonces hay un grupo
0:59
1:01
Y sí, el algoritmo de Aprendizaje Supervisado puede divide estos datos en estos dos grupos
separados.
1:06
Entonces esto se llama algoritmo de agrupamiento. Y esto resulta ser utilizado en muchos
lugares.
1:11
Un ejemplo donde la agrupación se usa está en Google Noticias y si no tienes visto esto antes,
en realidad puedes ve a esta URL news.google.com echar un vistazo. Lo que Google News hace
es todos los días va y mira decenas de miles o cientos de miles de nuevas historias en el web y
los agrupa en noticias cohesivas.
1:30
1:33
Las URL aquí vinculadas a diferentes noticias sobre la historia de BP Oil Well.
1:41
Entonces, hagamos clic en una de estas URL y lo haremos haga clic en una de estas URL. Lo que
llegaré es una página web como esta. Aquí hay un Wall Street Artículo de revista sobre, ya
sabes, el BP Historias de derrames de pozos petroleros de "BP mata a Macondo", que es un
nombre del derrame y si haga clic en una URL diferente
2:00
de ese grupo, entonces puede obtener la historia diferente. Aquí está la historia de CNN sobre
un juego, el derrame de petróleo de BP,
2:07
y si haces clic todavía un tercer enlace, entonces puede obtener una historia diferente. Aquí
está la historia del Guardian del Reino Unido sobre el derrame de petróleo de BP.
2:16
Entonces, ¿qué ha hecho Google News? es buscar decenas de miles de historias de noticias y
agruparlos automáticamente. Entonces, las noticias que son todas sobre el mismo tema se
muestran juntos. Resulta que algoritmos de agrupamiento y aprendizaje no supervisado los
algoritmos se usan en muchos otros problemas también.
2:35
2:38
Aquí hay un ejemplo de datos de microarrays de ADN. La idea está puesta un grupo de
diferentes individuos y para cada uno de ellos, usted mide cuánto tienen o no tienen cierto
gen. Técnicamente se mide la cantidad de ciertos genes que se expresan. Entonces estos
colores, rojo, verde, gris y así sucesivamente, ellos mostrar el grado en que diferentes
personas hacen o no tiene un gen específico
3:02
Y lo que puedes hacer es entonces ejecutar un algoritmo de agrupamiento para agrupar
individuos en diferentes categorías o en diferentes tipos de personas.
3:10
3:44
3:48
3:51
Tenía algunos amigos mirando grandes centros de datos, eso es grandes grupos de
computadoras y tratando para descubrir qué máquinas tienden a trabajar juntos y si puedes
juntar esas máquinas, puede hacer que su centro de datos funcione de manera más eficiente.
4:04
4:07
Así que, dado el conocimiento sobre qué amigos le envías el correo electrónico más o dado a
tus amigos de Facebook o sus círculos de Google+, pueden identificamos automáticamente
cuáles son grupos cohesivos de amigos, también que son grupos de personas que todos se
conocen?
4:22
Segmentación de mercado.
4:24
Muchas empresas tienen enormes bases de datos de información del cliente. Entonces,
¿puedes mirar esto? conjunto de datos del cliente y automáticamente descubrir segmentos de
mercado y automáticamente
4:33
agrupe a sus clientes en diferentes segmentos de mercado para que puedes automáticamente
y más Vender o comercializar eficientemente sus diferentes segmentos de mercado juntos?
4:44
Nuevamente, este es el Aprendizaje No Supervisado porque tenemos todo esto datos del
cliente, pero nosotros no saber de antemano cuáles son los segmentos de mercado y para los
clientes en nuestros datos establecer, ya sabes, no sabemos en avanzar quién está en
segmento de mercado uno, que es en el segmento de mercado dos, y así sucesivamente. Pero
tenemos que dejar que el algoritmo descubra todo esto solo a partir de los datos.
5:01
Finalmente, resulta que Sin supervisión El aprendizaje también se usa para análisis de datos
sorprendentemente astronómico y estos algoritmos de agrupamiento dan Teorías útiles
sorprendentemente interesantes de cómo se forman las galaxias. Todos estos son ejemplos de
agrupamiento, que es solo un tipo de aprendizaje no supervisado. Déjame contarte sobre otro.
Te voy a hablar sobre el problema del cóctel.
5:26
Entonces, has estado en cócteles antes, ¿verdad? Bueno, puedes imaginar que hay un fiesta,
sala llena de gente, todo sentados, hablando en el mismo tiempo y hay todas estas voces
superpuestas porque todo el mundo está hablando al mismo tiempo, y es casi difícil escuchar a
la persona frente a ti. Entonces tal vez en un cóctel con dos personas,
5:45
dos personas hablando al mismo tiempo, y es un tanto pequeño cóctel. Y vamos a poner dos
micrófonos en la habitación tan hay micrófonos, y porque estos micrófonos están en dos
diferentes distancias de la altavoces, cada registro de micrófono una combinación diferente de
estas dos voces de altavoz.
6:05
Tal vez el orador uno es un poco más fuerte en el micrófono uno y tal vez el altavoz dos es un
un poco más fuerte en el micrófono 2 porque los 2 micrófonos son en diferentes posiciones
relativas a los 2 parlantes, pero cada el micrófono causaría una superposición combinación de
las voces de ambos oradores.
6:23
6:26
de dos hablantes grabados por un investigador. Déjame jugar para ti primero, cómo suena el
primer micrófono One (uno), two (dos), tres (tres), cuatro (cuatro), cinco (cinco), six (seis),
seven (siete), eight (ocho), nine (nueve), ten (y diez).
6:41
Muy bien, tal vez no el cóctel más interesante fiesta, hay dos personas contando de uno a diez
en dos idiomas, pero ya sabes Lo que acabas de escuchar fue el primera grabación de
micrófono, aquí está la segunda grabación.
6:57
Uno (one), dos (two), tres (three), cuatro (four), cinco (five), seis (six), siete (seven), ocho
(eight), nueve (nine) y diez (ten). Entonces podemos hacer, es tomar estos dos grabadores de
micrófono y dan a un algoritmo de aprendizaje no supervisado llamado el algoritmo del cóctel,
y decir el algoritmo - encuentra estructura en esta información para ti. Y lo que hará el
algoritmo es escuchar estos grabaciones de audio y decir, usted Sé que suena como el dos
grabaciones de audio están siendo sumados o que han sido resumidos para producir estas
grabaciones que teníamos. Por otra parte, lo que el cóctel algoritmo hará es por separado
estas dos fuentes de audio que se estaban agregando o siendo sumados para formar otros
grabaciones y, de hecho, aquí está la primera salida del algoritmo del cóctel.
7:39
Uno dos tres CUATRO, cinco seis SIETE OCHO NUEVE DIEZ.
7:47
7:52
Y aquí está el segundo. Uno, dos, tres, quatro, cinco, seis, siete, ocho, nueve y diez. No está
mal, para darte
8:03
un ejemplo más, aquí hay otro grabación de otra situación similar, aquí está el primer
micrófono: uno, dos, tres, cuatro, cinco, seis, siete ocho NUEVE DIEZ.
8:16
De acuerdo, el pobre se fue casa de la fiesta y ahora está sentado en una habitación hablando
solo con su radio.
8:23
8:28
Uno dos tres CUATRO CINCO SEIS SIETE OCHO NUEVE DIEZ.
8:33
Cuando das estos dos micrófonos grabaciones al mismo algoritmo, lo que hace, es otra vez
decir, ya sabes, parece que hay son dos fuentes de audio, y además,
8:42
el álbum dice, aquí está la primera de las fuentes de audio que encontré.
8:47
Uno dos tres CUATRO, cinco seis SIETE OCHO NUEVE DIEZ.
8:54
Entonces eso no fue perfecto, obtuvo la voz, pero También obtuve un poco de la música allí.
Entonces aquí está la segunda salida al algoritmo.
9:10
No está mal, en ese segundo salida logró deshacerse de la voz por completo. Y solo, ya sabes,
limpió la música, se deshizo del recuento del uno al diez.
9:18
9:42
Resulta que el algoritmo, para haz lo que acabas de escuchar, eso se puede hacer con una línea
de código - se muestra aquí.
9:50
Lleva a los investigadores una larga hora de idear esta línea de código. No digo que este sea un
problema fácil, Pero resulta que cuando usa el entorno de programación correcto, muchos
aprendiendo los algoritmos pueden ser programas realmente cortos.
10:03
Entonces esta es también la razón por la cual esta clase vamos a usa el entorno de
programación Octave.
10:08
Octave, es fuente abierta gratuita software, y usando un herramienta como Octave o Matlab,
muchos algoritmos de aprendizaje se vuelven justos unas pocas líneas de código para
implementar. Más adelante en esta clase, solo enseñaré usted un poco sobre cómo usa Octave
y estarás implementando algunos de estos algoritmos en Octave. O si tienes Matlab puedes
usar eso también.
10:27
Resulta que el Silicon Valley, por una gran cantidad de algoritmos de aprendizaje automático,
lo que hacemos es el primer prototipo nuestro software en Octave porque el software en
Octave lo hace increíblemente rápido para implementar estos algoritmos de aprendizaje.
10:38
Aquí cada una de estas funciones como por ejemplo el SVD función que significa singular
descomposición del valor; pero eso gira ser un rutina de álgebra lineal, que está integrada en
Octave.
10:49
Si estabas tratando de hacer esto en C ++ o Java, esto sería muchas muchas líneas de código
que vincula bibliotecas complejas de C ++ o Java. Entonces, puedes implementar esto como C
++ o Java o Python, es solo mucho más complicado hacerlo en esos idiomas.
11:03
Lo que he visto después de haber enseñado aprendizaje automático para casi una década
ahora, es eso, tú aprende mucho más rápido si usa Octave como tu entorno de programación,
y si Usas Octave como tu herramienta de aprendizaje y como su herramienta de prototipado,
dejará aprendes y prototipas los algoritmos de aprendizaje mucho más rápido.
11:22
Y, de hecho, lo que mucha gente hacer en el Silicio grande Las compañías del valle es, de
hecho, uso un algoritmo como Octave para primero prototipo del algoritmo de aprendizaje, y
solo después de haberlo obtenido para trabajar, luego migras a C ++ o Java o lo que sea.
Resulta que al hacerlo cosas de esta manera, a menudo consigue tu algoritmo para trabajar
mucho más rápido que si estuvieras empezando en C ++.
11:44
Entonces, sé que como instructor, llego a di "confía en mí" este "solo un finito número de
veces, pero para aquellos de ustedes que nunca han usado estos Entornos de programación
tipo Octave antes, Voy a preguntarte confiar en mí en este, y di que tú, lo harás, Creo que tu
tiempo, tu desarrollo el tiempo es uno de los recursos más valiosos.
12:04
Y habiendo visto muchos de personas hacen esto, creo usted como un aprendizaje automático
investigador o desarrollador de aprendizaje automático será mucho más productivo si
aprendes a comenzar en prototipo, para comenzar en Octave, en algún otro idioma.
12:17
Finalmente, para envolver arriba de este video, tengo una pregunta de revisión rápida para
usted.
12:24
13:01
Entonces, con suerte, has recordado el problema de la carpeta de spam. Si tiene datos
etiquetados, saber, con spam y correo electrónico no spam, lo trataríamos como un problema
de aprendizaje supervisado.
13:11
El ejemplo de la historia de noticias, eso es exactamente el ejemplo de Google News que vimos
en este video, vimos cómo puedes usar un algoritmo de agrupamiento para agrupar estos
artículos juntos para que sea el aprendizaje no supervisado.
13:23
El ejemplo de segmentación de mercado I habló un poco antes, tú puede hacer eso como un
problema de aprendizaje no supervisado porque solo voy a obtener mi algoritmo de datos y
preguntar para descubrir segmentos de mercado de forma automática.
13:35
Y el último ejemplo, diabetes, bueno, eso es realmente como nuestro ejemplo de cáncer de
mama del último video. Solo en lugar de, ya sabes, tumores cancerosos buenos y malos o
tumores benignos o malignos que en cambio, tiene diabetes o no y así lo haremos usar eso
como supervisado, vamos a resolver eso como un problema de aprendizaje supervisado al
igual que lo hicimos para los datos del tumor de mama.
13:58
Podemos derivar esta estructura al agrupar los datos en función de las relaciones entre las
variables en los datos.
Ejemplo: