2015.machine Learning - Trends, Perspectives, and Prospects

Machine Translated by Google
A pesar de los desafíos prácticos, tenemos la esperanza REVISIÓN

de que las discusiones informadas entre los responsables de
la formulación de políticas y el público sobre los datos y las
capacidades del aprendizaje automático conduzcan a diseños
perspicaces de programas y políticas que puedan equilibrar
Aprendizaje automático:
los objetivos de proteger la privacidad y garantizar la equidad
con los de cosechar. los beneficios para la investigación tendencias, perspectivas y perspectivas
científica y para la salud individual y pública. Nuestros
compromisos con la privacidad y la equidad son perennes, MI Jordan1 * y TM Mitchell2 *
pero nuestras opciones de política deben adaptarse para
promoverlos y respaldar nuevas técnicas para profundizar nuestro conocimiento.
El aprendizaje automático aborda la cuestión de cómo construir computadoras que mejoren automáticamente a
través de la experiencia. Es uno de los campos técnicos de más rápido crecimiento en la actualidad, que se encuentra en
REFERENCIAS Y NOTAS
la intersección de la informática y la estadística, y en el núcleo de la inteligencia artificial y la ciencia de datos. El progreso
1. M. De Choudhury, S. Counts, E. Horvitz, A. Hoff, en Proceedings of
International Conference on Weblogs and Social Media [Asociación para reciente en el aprendizaje automático ha sido impulsado tanto por el desarrollo de nuevos algoritmos y teorías de
el Avance de la Inteligencia Artificial (AAAI), Palo Alto, CA, 2014]. aprendizaje como por la explosión en curso en la disponibilidad de datos en línea y computación de bajo costo. La adopción
de métodos de aprendizaje automático con uso intensivo de datos se puede encontrar en la ciencia, la tecnología y el
2. JS Brownstein, CC Freifeld, LC Madoff, N. Engl. J.Med. 360, 2153–2155
comercio, lo que lleva a una toma de decisiones más basada en evidencia en muchos ámbitos de la vida, incluida la
(2009).
3. G. Eysenbach, J. Med. Resolución de Internet 11, e11 (2009). atención médica, la fabricación, la educación, el modelado financiero, la vigilancia y el marketing. .
4. DA Broniatowski, MJ Paul, M. Dredze, PLOS UNO 8, e83672
(2013).
5. A. Sadilek, H. Kautz, V. Silenzio, en Actas de la Vigésima Sexta
El aprendizaje automático es una disciplina centrada ance a la hora de ejecutar alguna tarea, a través de algún tipo
Conferencia AAAI sobre Inteligencia Artificial (AAAI, Palo Alto,
CA, 2012).
en dos cuestiones interrelacionadas: ¿Cómo se de experiencia formativa. Por ejemplo, al aprender a detectar
6. M. De Choudhury, S. Counts, E. Horvitz, en Proceedings of the SIGCHI METRO pueden construir sistemas informáticos que mejoren el fraude con tarjetas de crédito, la tarea es asignar una
Conference on Human Factors in Computing Systems (Association automáticamente a través de la experiencia? y etiqueta de "fraude" o "no fraude" a cualquier transacción de
for Computing Machinery, Nueva York, 2013), págs. 3267–3276. ¿Cuáles son las estadísticas fundamentales? tarjeta de crédito determinada. La métrica de desempeño a
leyes teóricas de la información computacional que gobiernan mejorar podría ser la precisión de este clasificador de fraude,
7. RW White, R. Harpaz, NH Shah, W. DuMouchel, E. Horvitz, Clin. Farmacol.
El r. 96, 239–246 (2014). todos los sistemas de aprendizaje, incluidas las computadoras, y la experiencia de capacitación podría consistir en una
8. Radar Samaritanos; www.samaritans.org/how-we-can-help-you/supporting- los humanos y las organizaciones? El estudio del aprendizaje colección de transacciones históricas de tarjetas de crédito,
someone-online/samaritans-radar. automático es importante tanto para abordar estas cuestiones cada una etiquetada en retrospectiva como fraudulenta o no.
9. Apague el radar de samaritanos; http://bit.ly/Samaritans-after.
científicas y de ingeniería fundamentales como para el software Alternativamente, se podría definir una métrica de desempeño
10. Comisión de Igualdad de Oportunidades en el Empleo (EEOC) de EE.
informático altamente práctico que ha producido y aplicado en diferente que asigne una sanción más alta cuando "fraude" se
UU., 29 Código de Regulaciones Federales (CFR), 1630.2 (g) (2013).
11. EEOC, 29 CFR 1635.3 (c) (2013). muchas aplicaciones. etiqueta como "no fraude" que cuando "no fraude" se etiqueta
12. MA Rothstein, J. Ley Med. Ética 36, 837–840 (2008). incorrectamente como "fraude".
13. Oficina Ejecutiva del Presidente, Big Data: Aprovechando El aprendizaje automático ha progresado dramáticamente También se podría definir un tipo diferente de experiencia de
Oportunidades, Preservando Valores (Casa Blanca, Washington, DC,
en las últimas dos décadas, desde la curiosidad de laboratorio capacitación, por ejemplo, al incluir transacciones con tarjetas
2014); http://1.usa.gov/1TSOhiG.
14. Carta de Maneesha Mithal, FTC, a Reed Freeman, Morrison, & Foerster hasta una tecnología práctica de uso comercial generalizado. de crédito no etiquetadas junto con ejemplos etiquetados.
LLP, Abogado de Netflix, 2 [carta de cierre] (2010); http://1.usa.gov/ Dentro de la inteligencia artificial (IA), el aprendizaje automático
1GCFyXR. se ha convertido en el método elegido para desarrollar software Se ha desarrollado una amplia gama de algoritmos de
15. In re Facebook, Denuncia, FTC File No. 092 3184 (2012).
práctico para visión por computadora, reconocimiento de voz, aprendizaje automático para cubrir la amplia variedad de datos
science.sciencema
Descargado
enero
http://
2019
de
28
de
el 16. Informe del personal de la FTC, Divulgaciones de privacidad móvil: generar confianza
a través de la transparencia (FTC, Washington, DC, 2013); http://1.usa.gov/1eNz8zr.
17. FTC, Protección de la privacidad del consumidor en una era de cambios
rápidos: recomendaciones para empresas y legisladores (FTC,
Washington, DC, 2012).
procesamiento de lenguaje natural, control de robots y otras
aplicaciones. Muchos desarrolladores de sistemas de IA ahora
reconocen que, para muchas aplicaciones, puede ser mucho
más fácil entrenar un sistema mostrándole ejemplos del
y tipos de problemas que se presentan en los diferentes
problemas de aprendizaje automático (1, 2). Conceptualmente,
los algoritmos de aprendizaje automático pueden verse como
una búsqueda a través de un gran espacio de programas
18. Directiva 95/46/ec del Parlamento Europeo y del Consejo de Europa,
24 de octubre de 1995.
comportamiento de entrada-salida deseado que programarlo candidatos, guiados por la experiencia de capacitación, para
19. L. Sweeney, Los anuncios en línea tiran los dados [blog]; http://1.usa.gov/ manualmente anticipando la respuesta deseada para todas las encontrar un programa que optimice la métrica de rendimiento.
1KgEcYg. entradas posibles. El efecto del aprendizaje automático Los algoritmos de aprendizaje automático varían mucho, en
20. FTC, “Big data: ¿Una herramienta para la inclusión o la exclusión?” (taller,
también se ha sentido ampliamente en las ciencias de la parte por la forma en que representan programas candidatos
FTC, Washington, DC, 2014); http://1.usa.gov/1SR65cv 21. FTC, Agentes
de datos: un llamado a la transparencia y la responsabilidad (FTC, Washington,
computación y en una variedad de industrias relacionadas con (por ejemplo, árboles de decisión, funciones matemáticas y
DC, 2014); http://1.usa.gov/1GCFoj5. problemas de uso intensivo de datos, como los servicios al lenguajes de programación en general) y en parte por la forma
22. J. Podesta, “Big data y privacidad: 1 año fuera” [blog]; http://bit. ly/ consumidor, el diagnóstico de fallas en sistemas complejos y en que buscan a través de este espacio de programas (por
WHsePrivacy.
el control de cadenas logísticas. Ha habido una amplia gama ejemplo, , algoritmos de optimización con garantías de
23. Consejo de Asesores Económicos, Big Data y Precios Diferenciales de la
similar de efectos en las ciencias empíricas, desde la biología convergencia bien entendidas y métodos de búsqueda
Casa Blanca (Casa Blanca, Washington, DC, 2015).
24. Oficina Ejecutiva del Presidente, Big Data y Procesamiento Diferencial hasta la cosmología y las ciencias sociales, a medida que se evolutiva que evalúan generaciones sucesivas de programas
(Casa Blanca, Washington, DC, 2015); http://1.usa.gov/1eNy7qR. han desarrollado métodos de aprendizaje automático para mutados aleatoriamente). Aquí, nos enfocamos en enfoques
25. Oficina Ejecutiva del Presidente, Big Data: Aprovechando analizar datos experimentales de alto rendimiento de formas que han sido particularmente exitosos hasta la fecha.
Oportunidades, Preservando Valores (Casa Blanca, Washington, DC,
novedosas. Consulte la Fig. 1 para ver una descripción de
2014); http://1.usa.gov/1TSOhiG.
26. Consejo de Asesores del Presidente sobre Ciencia y Tecnología algunas áreas recientes de aplicación del aprendizaje Muchos algoritmos se centran en problemas de
(PCAST), Big Data and Privacy: A Technological Perspective (Casa automático. aproximación de funciones, donde la tarea se materializa en
Blanca, Washington, DC, 2014); http://1.usa.gov/1C5ewNv. una función (por ejemplo, dada una transacción de entrada,
27. Comisión Europea, Propuesta de Reglamento del Parlamento Europeo y
del Consejo relativo a la protección de las personas en lo que respecta al
Un problema de aprendizaje puede definirse como el se emite una etiqueta de "fraude" o "no fraude"), y el problema
tratamiento de datos personales y a la libre circulación de dichos datos problema de mejorar alguna medida del desempeño de aprendizaje es mejorar la precisión de esa función, con
(Reglamento general de protección de datos), COM(2012) 11 definitiva experiencia que consiste en una muestra de pares de entrada-
(2012); http://bit.ly/1Lu5POv. 1
Departamento de Ingeniería Eléctrica y Ciencias de la Computación, Departamento salida conocidos de la función. En algunos casos, la función
28. M. Schrems contra Facebook Ireland Limited, §J. datos ilegítimos de Estadística, Universidad de California, Berkeley, CA, EE. UU.
se representa explícitamente como una forma funcional
transmisión a EE. UU. (“PRISM”), ¶166 y 167 (2013); www.europe-v- 2
Departamento de aprendizaje automático, Carnegie
facebook.org/sk/sk_en.pdf. parametrizada; en otros casos, la función es implícita y se
Universidad de Mellon, Pittsburgh, Pensilvania, Estados Unidos.
*Autor correspondiente. Correo electrónico: jordan@cs.berkeley.edu (MIJ);

obtiene a través de un proceso de búsqueda, una factorización,
10.1126/ciencia.aac4520 tom.mitchell@cs.cmu.edu (TMM) una optimización
CIENCIA cienciamag.org 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 255

INTELIGENCIA ARTIFICIAL
procedimiento, o un procedimiento basado en simulación.

Incluso cuando está implícita, la función generalmente
depende de parámetros u otros grados de libertad
ajustables, y el entrenamiento corresponde a encontrar
valores para estos parámetros que optimicen la métrica de
rendimiento.
Cualquiera que sea el algoritmo de aprendizaje, un
objetivo científico y práctico clave es caracterizar
teóricamente las capacidades de algoritmos de aprendizaje
específicos y la dificultad inherente de cualquier problema
de aprendizaje dado: ¿Con qué precisión puede aprender
el algoritmo de un tipo y volumen particular de datos de
entrenamiento? ¿Qué tan robusto es el algoritmo a errores
en sus supuestos de modelado oa errores en los datos de
entrenamiento? Dado un problema de aprendizaje con un
volumen dado de datos de entrenamiento, ¿es posible
diseñar un algoritmo exitoso o este problema de aprendizaje
es fundamentalmente intratable? Tales caracterizaciones
Caracteres Sintaxis teóricas de los algoritmos y problemas de aprendizaje
Visual Movimiento automático suelen hacer uso de los marcos familiares de la
Semántica teoría de la decisión estadística y la teoría de la complejidad
Diálogo
computacional. De hecho, los intentos de caracterizar los
algoritmos de aprendizaje automático teóricamente han
llevado a combinaciones de teoría estadística y
computacional en las que el objetivo es caracterizar
simultáneamente la complejidad de la muestra (cuántos
datos se requieren para aprender con precisión) y la
complejidad computacional (cuántos se requiere
computación) y especificar cómo estos dependen de las
características del algoritmo de aprendizaje, como la
representación que utiliza para lo que aprende (3–6). Una
forma específica de análisis computacional que ha resultado
particularmente útil en los últimos años ha sido la de la
lata de leche 1.00 teoría de la optimización, con límites superior e inferior en
persona 0.92 antílope 0.68 lata de leche 1.00
las tasas de convergencia de los procedimientos de
optimización que se fusionan bien con la formulación de
problemas de aprendizaje automático como la optimización
science.sciencema
Descargado
enero
http://
2019
de
28
de
el gafas de sol 0.52
de un rendimiento. métrica (7, 8).
Como campo de estudio, el aprendizaje automático se

encuentra en la encrucijada de la informática, la estadística
y una variedad de otras disciplinas relacionadas con la
mejora automática a lo largo del tiempo, y la inferencia y la
toma de decisiones en condiciones de incertidumbre. Las
disciplinas relacionadas incluyen el estudio psicológico del
aprendizaje humano, el estudio de la evolución, la teoría
del control adaptativo, el estudio de las prácticas educativas,
naranja 0.73 pájaro 0,69 la neurociencia, el comportamiento organizacional y la economía.
pájaro 0.95 Aunque la última década ha visto un aumento de la
isópodo 0,55
conversación cruzada con estos otros campos, apenas
pájaro 0.78 estamos comenzando a aprovechar las sinergias potenciales
y la diversidad de formalismos y métodos experimentales
limón 0.86 estrella de mar 0.67 utilizados en estos múltiples campos para estudiar sistemas
que mejoran con la experiencia.
Impulsores del progreso del aprendizaje automático
La última década ha visto un rápido crecimiento en la

capacidad de los sistemas informáticos móviles y en red
para recopilar y transportar grandes cantidades de datos,
un fenómeno que a menudo se denomina "Big Data". Los
científicos e ingenieros que recopilan dichos datos a
Fig. 1. Aplicaciones del aprendizaje automático. El aprendizaje automático está teniendo un efecto sustancial en menudo han recurrido al aprendizaje automático.
muchas áreas de la tecnología y la ciencia; ejemplos de historias de éxito aplicadas recientes incluyen robótica y Buscando soluciones al problema de obtener conocimientos,
control de vehículos autónomos (arriba a la izquierda), procesamiento del habla y procesamiento del lenguaje natural predicciones y decisiones útiles a partir de tales conjuntos
(arriba a la derecha), investigación en neurociencia (centro) y aplicaciones en visión por computadora (abajo). [El de datos. De hecho, el gran tamaño de los datos hace que
panel central está adaptado de (29). Las imágenes en el panel inferior son de la base de datos de ImageNet; la sea esencial desarrollar procedimientos escalables que
AKINBOSTANCI
CRÉDITO:
ISTOCK/
anotación de reconocimiento de objetos es de R. Girshick.] mezclen computacional y estadístico.
256 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 cienciamag.org CIENCIA

consideraciones, pero el problema va más allá del mero trabajar en algoritmos de aprendizaje automático, teoría y árboles de decisión, bosques de decisión, regresión
tamaño de los conjuntos de datos modernos; es la práctica. logística, máquinas de vectores de soporte, redes
naturaleza granular y personalizada de gran parte de estos neuronales, máquinas kernel y clasificadores bayesianos
datos. Los dispositivos móviles y la computación integrada Métodos básicos y avances recientes (1). Se ha propuesto una variedad de algoritmos de
permiten recopilar grandes cantidades de datos sobre Los métodos de aprendizaje automático más utilizados son aprendizaje para estimar estos diferentes tipos de mapeos,
seres humanos individuales, y los algoritmos de aprendizaje los métodos de aprendizaje supervisado (1). Los sistemas y también existen procedimientos genéricos como boosting
automático pueden aprender de estos datos para personalizarlos.
de aprendizaje supervisado, incluidos los clasificadores de y aprendizaje de múltiples núcleos que combinan los
sus servicios a las necesidades y circunstancias spam de correo electrónico, los reconocedores de rostros resultados de múltiples algoritmos de aprendizaje.
de cada individuo. Además, estos servicios personalizados sobre imágenes y los sistemas de diagnóstico médico para Los procedimientos para aprender f de los datos a menudo
se pueden conectar, de modo que surge un servicio global pacientes, ejemplifican el problema de aproximación de hacen uso de ideas de la teoría de la optimización o del
que aprovecha la riqueza y diversidad de datos de muchas funciones discutido anteriormente, donde los datos de análisis numérico, con la forma específica de problemas
personas sin dejar de adaptarse a las necesidades y entrenamiento toman la forma de una colección de (x, y) de aprendizaje automático (p. ej., que la función objetivo o
circunstancias de cada uno. Se pueden encontrar instancias pares y el objetivo es producir una predicción y* en la función que se va a integrar es a menudo la suma de un
de esta tendencia hacia la captura y extracción de grandes respuesta a una consulta x*. Las entradas x pueden ser gran número de términos). impulsando innovaciones. Esta
cantidades de datos para mejorar los servicios y la vectores clásicos o pueden ser objetos más complejos diversidad de arquitecturas y algoritmos de aprendizaje
productividad en muchos campos del comercio, la ciencia como documentos, imágenes, secuencias de ADN o refleja las diversas necesidades de las aplicaciones, con
y el gobierno. Los registros médicos históricos se utilizan diferentes
gráficos. De manera similar, se han estudiado muchos tipos diferentes arquitecturas
de salida y. que capturan diferentes tipos de
para descubrir qué pacientes responderán mejor a qué Se ha avanzado mucho centrándose en el problema de estructuras matemáticas, ofrecen diferentes niveles de
tratamientos; los datos de tráfico históricos se utilizan para clasificación binaria simple en el que y toma uno de dos adaptabilidad a la visualización y explicación post-hoc, y
mejorar el control del tráfico y reducir la congestión; los valores (por ejemplo, "correo basura" o "no correo basura"), brindan diversas compensaciones entre la complejidad
datos históricos de delitos se utilizan para ayudar a ubicar pero también ha habido abundante investigación sobre computacional, la cantidad de datos y rendimiento.
a la policía local en lugares específicos en momentos problemas como la clasificación multiclase. (donde y toma
específicos; y se capturan y seleccionan grandes conjuntos una de las K etiquetas), clasificación multietiqueta (donde Un área de progreso de alto impacto en el aprendizaje
de datos experimentales para acelerar el progreso en y es etiquetada simultáneamente por varias de las K supervisado en los últimos años involucra las redes
biología, astronomía, neurociencia y otras ciencias etiquetas), problemas de clasificación (donde y proporciona profundas, que son redes multicapa de unidades de umbral,
empíricas intensivas en datos. Parece que estamos al un orden parcial en algún conjunto) y problemas generales cada una de las cuales calcula alguna función parametrizada
comienzo de una tendencia de décadas hacia la toma de de predicción estructurada (donde y es un objeto simple de sus entradas (9, 10). Los sistemas de aprendizaje
decisiones cada vez más intensiva en datos y basada en combinatorio como un gráfico, cuyos componentes pueden profundo utilizan algoritmos de optimización basados en
evidencia en muchos aspectos de la ciencia, el comercio y ser necesarios para satisfacer algún conjunto de gradientes para ajustar los parámetros a lo largo de una
el gobierno. restricciones). Un ejemplo del último problema es el red multicapa de este tipo en función de los errores en su
etiquetado de parte del discurso, donde el objetivo es salida. Aprovechando las modernas arquitecturas de
Con la creciente importancia de los datos a gran escala etiquetar simultáneamente cada palabra en una oración de cómputo en paralelo, como las unidades de procesamiento
en todas las áreas del esfuerzo humano, ha surgido una entrada x como un sustantivo, verbo o alguna otra parte de gráficos desarrolladas originalmente para videojuegos,
ola de nuevas demandas sobre los algoritmos de del discurso. El aprendizaje supervisado también incluye ha sido posible construir sistemas de aprendizaje profundo
aprendizaje automático subyacentes. Por ejemplo, grandes casos en los que y tiene componentes de valor real o una que contienen miles de millones de parámetros y que
conjuntos de datos requieren algoritmos computacionalmente mezcla de componentes discretos y de valor real. pueden entrenarse en las grandes colecciones de
manejables, los datos altamente personales plantean la imágenes, videos y voz. muestras disponibles en Internet.
science.sciencema
Descargado
enero
http://
2019
de
28
de
el necesidad de algoritmos que minimicen los efectos de
privacidad, y la disponibilidad de grandes cantidades de
datos sin etiquetar plantea el desafío de diseñar algoritmos
de aprendizaje para aprovecharlos. Las siguientes
Los sistemas de aprendizaje supervisado generalmente
forman sus predicciones a través de un mapeo aprendido
f(x), que produce una salida y para cada entrada x (o una
distribución de probabilidad sobre y dada x). Existen
Estos sistemas de aprendizaje profundo a gran escala han
tenido un efecto importante en los últimos años en la visión
por computadora (11) y el reconocimiento de voz (12),
donde han producido mejoras importantes en el rendimiento
secciones examinan algunos de los efectos de estas demandas muchas
en los últimos
formas diferentes de mapeo f, incluyendo con respecto a los enfoques anteriores.
Imagen de entrada Extracción de características convolucionales RNN con atención sobre la imagen Generación palabra
por palabra
pájaro
volador
LSTM sobre
un cuerpo
de
mapa de características de 14 x 14
agua
A pájaro volador sobre a cuerpo de agua .
Fig. 2. Generación automática de leyendas de texto para imágenes con redes profundas. Se entrena una red neuronal convolucional para interpretar imágenes, y su
salida luego es utilizada por una red neuronal recurrente entrenada para generar una leyenda de texto (arriba). La secuencia en la parte inferior muestra el enfoque
palabra por palabra de la red en diferentes partes de la imagen de entrada mientras genera el título palabra por palabra. [Adaptado con permiso de (30)] CRÉDITO:
ISTOCK/
CORR

Temas Documentos
gen 0,04
adn 0,02 Proporciones
genético 0,01 temáticas y asignaciones
.,,
genes organismo genes
¿sobrevivir?
vida 0,02 vida. genético

0,01 computadora números
0,01
evolucionar organismo genomas
organismos
.,,
genoma secuenciado
genes computacional
cerebro 0,04
neurona 0,02
nervio 0,01
.,,
predicciones
0,02 Análisis informático

0,02
0,01 de datos
computador numero
.,,
Figura 3. Modelos temáticos. El modelado de temas es una metodología para analizar documentos, donde un documento se ve como una colección de palabras, y
las palabras en el documento se ven como generadas por un conjunto subyacente de temas (indicados por los colores en la figura). Los temas son distribuciones de
probabilidad entre palabras (columna más a la izquierda), y cada documento se caracteriza por una distribución de probabilidad entre temas (histograma). Estas
distribuciones se infieren en función del análisis de una colección de documentos y se pueden ver para clasificar, indexar y resumir el contenido de los documentos. [De (31).
Copyright 2012, Association for Computing Machinery, Inc. Reimpreso con permiso]
(ver Fig. 2). Los métodos de redes profundas se están buscando se desarrollan ritmos para optimizar el criterio. La energía está entrenada para elegir acciones para cualquier
activamente en una variedad de aplicaciones adicionales, desde Como otro ejemplo, el agrupamiento es el problema de encontrar estado dado, con el objetivo de maximizar su recompensa
la traducción del lenguaje natural hasta el filtrado colaborativo. una partición de los datos observados (y una regla para predecir esperada con el tiempo. Los vínculos con la investigación en el control
datos futuros) en ausencia de etiquetas explícitas que indiquen la teoría y la investigación operativa han aumentado a lo largo
Se puede considerar que las capas internas de las redes una partición deseada. de los años, con formulaciones como los procesos de decisión
profundas proporcionan representaciones aprendidas de los Se ha desarrollado una amplia gama de procedimientos de de Markov y los procesos de decisión de Markov parcialmente
science.sciencema
Descargado
enero
http://
2019
de
28
de
el datos de entrada. Si bien gran parte del éxito práctico en el
aprendizaje profundo proviene de los métodos de aprendizaje
supervisado para descubrir tales representaciones, también se
han hecho esfuerzos para desarrollar algoritmos de aprendizaje
agrupamiento, todos basados en supuestos específicos
relacionados con la naturaleza de un “conglomerado”. Tanto en
el agrupamiento como en la reducción de dimensiones, la
preocupación por la complejidad computacional es primordial,
observados que proporcionan puntos de contacto (15, 16). Los
algoritmos de aprendizaje por refuerzo generalmente hacen uso
de ideas que son familiares de la literatura de la teoría del
control, como la iteración de políticas, la iteración de valores, los
profundo que descubren representaciones útiles de la entrada dado que el objetivo es explotar los conjuntos de datos lanzamientos y la reducción de la varianza, con innovaciones
sin necesidad de etiquetar los datos de entrenamiento (13). . El particularmente grandes que están disponibles si se prescinde que surgen para abordar las necesidades específicas del
problema general se conoce como aprendizaje no supervisado, de las etiquetas supervisadas. aprendizaje automático (por ejemplo, problemas a gran escala). ,
un segundo paradigma en la investigación del aprendizaje Un tercer paradigma importante de aprendizaje automático pocas suposiciones sobre el entorno dinámico desconocido y el
automático (2). es el aprendizaje por refuerzo (14, 15). Aquí, la información uso de arquitecturas de aprendizaje supervisado para representar
En términos generales, el aprendizaje no supervisado disponible en los datos de entrenamiento es intermedia entre el políticas). También vale la pena señalar los fuertes vínculos
generalmente implica el análisis de datos no etiquetados bajo aprendizaje supervisado y no supervisado. En lugar de ejemplos entre el aprendizaje por refuerzo y muchas décadas de trabajo
suposiciones sobre las propiedades estructurales de los datos de entrenamiento que indiquen la salida correcta para una sobre el aprendizaje en psicología y neurociencia, un ejemplo
(por ejemplo, algebraicas, combinatorias o probabilísticas). Por entrada dada, se supone que los datos de entrenamiento en el notable es el uso de algoritmos de aprendizaje por refuerzo para
ejemplo, se puede suponer que los datos se encuentran en una aprendizaje por refuerzo proporcionan solo una indicación de si predecir la respuesta de las neuronas dopaminérgicas en monos
variedad de baja dimensión y apuntar a identificar esa variedad una acción es correcta o no; si una acción es incorrecta, queda que aprenden a asociar un estímulo de luz. con posterior
explícitamente a partir de los datos. Los métodos de reducción el problema de encontrar la acción correcta. Más generalmente, recompensa de azúcar (17).
de dimensiones, incluidos el análisis de componentes principales, en el establecimiento de secuencias de entradas, se supone
el aprendizaje múltiple, el análisis factorial, las proyecciones que las señales de recompensa se refieren a la secuencia
aleatorias y los codificadores automáticos (1, 2), hacen completa; la asignación de crédito o culpa a las acciones Aunque estos tres paradigmas de aprendizaje ayudan a
suposiciones específicas diferentes con respecto a la variedad individuales en la secuencia no se proporciona directamente. De organizar ideas, gran parte de la investigación actual implica
subyacente (por ejemplo, que es un subespacio lineal, un hecho, aunque se estudian versiones simplificadas del combinaciones entre estas categorías. Por ejemplo, el
subespacio suave). variedad no lineal, o una colección de aprendizaje por refuerzo conocidas como problemas de aprendizaje semisupervisado utiliza datos no etiquetados para
subvariedades). Otro ejemplo de reducción de dimensiones es bandidos, en las que se supone que se proporcionan aumentar los datos etiquetados en un contexto de aprendizaje
el marco de modelado de temas que se muestra en la figura 3. recompensas después de cada acción, los problemas de supervisado, y el entrenamiento discriminativo combina
aprendizaje por refuerzo suelen implicar un entorno teórico de arquitecturas desarrolladas para el aprendizaje no supervisado
Se define una función de criterio que incorpora control general en el que la tarea de aprendizaje es aprender con formulaciones de optimización que utilizan etiquetas. La
estos supuestos, a menudo haciendo uso de principios una estrategia de control. (una "política") para un agente que selección de modelos es la actividad amplia de usar datos de
estadísticos generales como la máxima verosimilitud, el método actúa en un entorno dinámico desconocido, donde esa estrategia entrenamiento no solo para ajustar un modelo sino también para
de los momentos o la integración bayesiana, y algoritmos de aprendida seleccionar de una familia de modelos, y el hecho de que los
AKINBOSTANCI
CRÉDITO:
ISTOCK/
optimización o muestreo. datos de entrenamiento no indican directamente

qué modelo usar conduce al uso de algoritmos desarrollados vacío La privacidad se puede formalizar a través de la revelan la mayor parte de su genoma en el contexto de la
para problemas de bandidos y a procedimientos de noción de "privacidad diferencial", que define un canal investigación de una enfermedad que corre en su familia,
optimización bayesianos. El aprendizaje activo surge probabilístico entre los datos y el mundo exterior, de modo pero pueden solicitar una protección más estricta si la
cuando al alumno se le permite elegir puntos de datos y que un observador de la salida del canal no puede inferir de información sobre su genoma se utiliza para establecer las
consultar al entrenador para solicitar información específica, forma fiable si determinados individuos han proporcionado tarifas del seguro.
como la etiqueta de un ejemplo no etiquetado de otro modo. datos o no (18). . Las aplicaciones clásicas de la privacidad La comunicación es otro recurso que necesita
El modelado causal es el esfuerzo por ir más allá del simple diferencial implican asegurar que las consultas (p. ej., "¿cuál ser administrado dentro del contexto general de un sistema
descubrimiento de relaciones predictivas entre variables, es el saldo máximo en un conjunto de cuentas?") a una de aprendizaje distribuido. Por ejemplo, los datos pueden
para distinguir qué variables influyen causalmente en otras base de datos privatizada arrojan una respuesta cercana a estar distribuidos en distintas ubicaciones físicas porque su
(p. ej., un recuento alto de glóbulos blancos puede predecir la que arrojan los datos no privados. tamaño no les permite
la existencia de una infección, pero es la infección la que agregarse en un solo sitio o debido a los límites
causa el alto número de glóbulos blancos). recuento de Investigaciones recientes han puesto en contacto la administrativos. En tal entorno, es posible que deseemos
glóbulos blancos). Muchos problemas influyen en el diseño privacidad diferencial con el aprendizaje automático, donde imponer una restricción de comunicación de tasa de bits en
de los algoritmos de aprendizaje en todos estos paradigmas, las consultas implican predicciones u otras afirmaciones el algoritmo de aprendizaje automático. Resolver el problema
incluido si los datos están disponibles en lotes o si llegan inferenciales (p. ej., "dados los datos que he visto hasta de diseño bajo tal restricción generalmente mostrará cómo
secuencialmente a lo largo del tiempo, cómo se han ahora, ¿cuál es la probabilidad de que una nueva transacción se degrada el rendimiento del sistema de aprendizaje con
muestreado los datos, los requisitos de que los usuarios sea fraudulenta?") (19, 20). Situar el diseño general de un la disminución del ancho de banda de comunicación, pero
puedan interpretar los modelos aprendidos y los problemas sistema de aprendizaje automático que mejora la privacidad también puede revelar cómo mejora el rendimiento a medida
de solidez que surgen cuando los datos. no se ajustan a las dentro de un marco teórico de decisiones proporciona a los que aumenta el número de sitios distribuidos (p. ej.,
suposiciones de modelos anteriores. usuarios una perilla de ajuste mediante la cual pueden elegir máquinas o procesadores). aumenta, compensando estas
el nivel deseado de privacidad que tiene en cuenta los tipos cantidades con la cantidad de datos (21, 22). Al igual que
Tendencias emergentes de preguntas que se le harán a los datos y su propia utilidad en la teoría clásica de la información, esta línea de
El campo del aprendizaje automático es lo suficientemente personal para las respuestas. Por ejemplo, una persona investigación tiene como objetivo los límites inferiores
joven como para expandirse rápidamente, a menudo puede estar dispuesta a fundamentales del rendimiento alcanzable y los algoritmos
mediante la invención de nuevas formalizaciones de específicos que logran esos límites inferiores.
problemas de aprendizaje automático impulsadas por
aplicaciones prácticas. (Un ejemplo es el desarrollo de Un objetivo principal de esta línea general de investigación
sistemas de recomendación, como se describe en la Fig. es poner en contacto los tipos de recursos estadísticos
4). Una tendencia importante que impulsa esta expansión estudiados en el aprendizaje automático (por ejemplo, la
es una creciente preocupación por el entorno en el que cantidad de puntos de datos, la dimensión de un parámetro
opera un algoritmo de aprendizaje automático. La palabra y la complejidad de una clase de hipótesis) con los recursos
"entorno" aquí se refiere en parte a la arquitectura computacionales clásicos del tiempo. y espacio Tal puente
informática; Mientras que un sistema de aprendizaje está presente en el marco de aprendizaje "probablemente
automático clásico implicaba un solo programa que se aproximadamente correcto" (PAC), que estudia el efecto de
ejecutaba en una sola máquina, ahora es común que los agregar una restricción de cálculo de tiempo polinomial en
sistemas de aprendizaje automático se implementen en esta relación entre las tasas de error, el tamaño de los datos
arquitecturas que incluyen muchos miles o decenas de miles de entrenamiento y otros parámetros del algoritmo de
science.sciencema
Descargado
enero
http://
2019
de
28
de
el de procesadores, de modo que las limitaciones de
comunicación y las cuestiones de paralelismo y
procesamiento distribuido ocupan un lugar central. De
hecho, como se muestra en la figura 5, los sistemas de
aprendizaje ( 3). Los avances recientes en esta línea de
investigación incluyen varios límites inferiores que establecen
brechas fundamentales en el rendimiento alcanzable en
ciertos problemas de aprendizaje automático (p. ej.,
aprendizaje automático adoptan cada vez más la forma de regresión dispersa y análisis de componentes principales
colecciones complejas de software que se ejecutan en dispersas) a través de algoritmos de tiempo polinomial y
plataformas informáticas paralelas y distribuidas a gran tiempo exponencial (23). El núcleo del problema, sin
escala y proporcionan una variedad de algoritmos y servicios a los analistas de datos. embargo, involucra compensaciones de datos de tiempo
La palabra "entorno" también se refiere a la fuente de los que están lejos del límite polinomial/exponencial. Los
datos, que va desde un conjunto de personas que pueden grandes conjuntos de datos que son cada vez más la norma
tener preocupaciones sobre la privacidad o la propiedad, requieren algoritmos cuyos requisitos de tiempo y espacio
hasta el analista o la persona que toma las decisiones, que sean lineales o sublineales en el tamaño del problema
puede tener ciertos requisitos en un sistema de aprendizaje (número de puntos de datos o número de dimensiones). Las
automático (por ejemplo, ejemplo, que su salida sea investigaciones recientes se centran en métodos como el
visualizable), y al marco social, legal o político que rodea el submuestreo, las proyecciones aleatorias y el debilitamiento
despliegue de un sistema. de algoritmos para lograr escalabilidad manteniendo el
El entorno también puede incluir otros sistemas de control estadístico (24, 25).
aprendizaje automático u otros agentes, y la colección El objetivo final es poder proporcionar presupuestos de
general de sistemas puede ser cooperativa o adversaria. tiempo y espacio a los sistemas de aprendizaje automático
En términos generales, los entornos proporcionan varios Fig. 4. Sistemas de recomendación. Un sistema de además de los requisitos de precisión, con el sistema
recursos a un algoritmo de aprendizaje y imponen recomendación es un sistema de aprendizaje automático encontrando un punto operativo que permita cumplir dichos
restricciones a esos recursos. Cada vez más, los que se basa en datos que indican vínculos entre un requisitos.
investigadores de aprendizaje automático están formalizando conjunto de usuarios (p. ej., personas) y un conjunto de
estas relaciones, con el objetivo de diseñar algoritmos que elementos (p. ej., productos). Un enlace entre un usuario Oportunidades y desafíos
sean demostrablemente efectivos en varios entornos y y un producto significa que el usuario ha mostrado interés en A pesar de sus éxitos prácticos y comerciales, el aprendizaje
permitan explícitamente a los usuarios expresar y controlar el producto de alguna manera (quizás comprando ese automático sigue siendo un campo joven con muchas
las compensaciones entre los recursos. artículo en el pasado). El problema del aprendizaje oportunidades de investigación poco exploradas.
Como ejemplo de limitaciones de recursos, supongamos automático es sugerir otros artículos a un usuario Algunas de estas oportunidades se pueden ver al contrastar
que los datos son proporcionados por un conjunto de determinado que también le pueden interesar, según los los enfoques actuales de aprendizaje automático con los
personas que desean conservar un grado de privilegiado. datos de todos los usuarios. tipos de aprendizaje que observamos en forma natural. CRÉDITO:
ISTOCK/
CORR

Aplicaciones internas
la sociedad se beneficie de ellos, si así lo desea.
Genómica del cáncer, depuración energética, edificios inteligentes
De hecho, gran parte de estos datos son de propiedad
muestra limpia G-OLA ML Base privada, a pesar de que son datos sobre cada uno de
Acceso e nosotros. Consideraciones como estas sugieren que es
BlinkDB interfaces probable que el aprendizaje automático sea una de las
SparkR GráficoX
Chapoteo
MLPiplines velox
transmisión
chispas
de
tecnologías más transformadoras del siglo XXI.

SparkSQL MLIib
motor de Aunque es imposible predecir el futuro, parece esencial
procesamiento que la sociedad comience ahora a considerar cómo
Núcleo de chispa
maximizar sus beneficios.
Sucinto
HDFS, S3, Ceph, … Almacenamiento REFERENCIAS

Taquión
1. T. Hastie, R. Tibshirani, J. Friedman, Los elementos del aprendizaje
estadístico: minería de datos, inferencia y predicción (Springer, Nueva
virtualización York, 2011).
mesos Hilo Hadoop 2. K. Murphy, Machine Learning: A Probabilistic Perspective (MIT Press,
de recursos
Cambridge, MA, 2012).
3. L. Valiente, Comun. ACM 27, 1134–1142 (1984).
AMPLab desarrollado Comunidad chispa Tercera parte
4. V. Chandrasekaran, MI Jordan, Proc. nacional Academia ciencia EE.UU
110, E1181–E1190 (2013).
Fig. 5. Pila de análisis de datos. Los sistemas escalables de aprendizaje automático son arquitecturas en capas 5. S. Decatur, O. Goldreich, D. Ron, SIAM J. Comput. 29, 854–879
que se crean en plataformas informáticas paralelas y distribuidas. La arquitectura que se muestra aquí, una pila de (2000).
6. S. Shalev-Shwartz, O. Shamir, E. Tromer, Using more data to speed up
análisis de datos de código abierto desarrollada en el Laboratorio de Algoritmos, Máquinas y Personas (AMP) de
training time, Proceedings of the Fifteenth Conference on Artificial
la Universidad de California, Berkeley, incluye capas que interactúan con los sistemas operativos subyacentes; Intelligence and Statistics, Islas Canarias, España, 21 al 23 de abril de
capas que proporcionan almacenamiento distribuido, gestión y procesamiento de datos; y capas que brindan 2012.
7. S. Boyd, N. Parikh, E. Chu, B. Peleato, J. Eckstein, en
competencias básicas de aprendizaje automático, como transmisión, submuestreo, canalizaciones, procesamiento
Foundations and Trends in Machine Learning 3 (Now
de gráficos y servicio de modelos.
Publishers, Boston, 2011), págs. 1–122.
8. S. Sra, S. Nowozin, S. Wright, Optimización para el aprendizaje
sistemas que ocurren como humanos y otros animales, organizaciones y la evolución biológica y ver el aprendizaje
automático (MIT Press, Cambridge, MA, 2011). 9.
organizaciones, economías y evolución biológica. Por automático beneficiarse de los estudios en curso de estos J. Schmidhuber, Neural Netw. 61, 85–117 (2015).
ejemplo, mientras que la mayoría de los algoritmos de otros tipos de sistemas de aprendizaje. 10. Y. Bengio, en Fundamentos y tendencias del aprendizaje automático 2
aprendizaje automático están destinados a aprender una Al igual que con cualquier tecnología poderosa, el (Now Publishers, Boston, 2009), págs. 1–127.
11. A. Krizhevsky, I. Sutskever, G. Hinton, Adv. Información neuronal Proceso.
función específica o un modelo de datos de una sola aprendizaje automático plantea preguntas sobre cuáles
sist. 25, 1097–1105 (2015).
fuente de datos, los humanos claramente aprenden de sus usos potenciales la sociedad debería alentar y 12. G. Hinton et al., IEEE Signal Process. revista 29, 82–97
muchas habilidades y tipos de conocimiento diferentes, a desalentar. El impulso de los últimos años para recopilar (2012).
13. GE Hinton, RR Salakhutdinov, Science 313, 504–507
partir de años de experiencia de capacitación diversa, nuevos tipos de datos personales, motivado por su valor
(2006).
supervisada y no supervisada, de una manera simple. económico, conduce a problemas de privacidad obvios,
14. V. Mnih et al., Nature 518, 529–533 (2015).
Secuencia de -a-más-difícil (p. ej., aprender a gatear, como se mencionó anteriormente. El creciente valor de 15. RS Sutton, AG Barto, Aprendizaje por refuerzo: una
luego a caminar, luego a correr). Esto ha llevado a los datos también plantea una segunda cuestión ética: ¿Quién tendrá
introducción (MIT Press, Cambridge, MA, 1998).
science.sciencema
Descargado
enero
http://
2019
de
28
de
el algunos investigadores a comenzar a explorar la cuestión
de cómo construir una computadora con estudiantes
permanentes o interminables que operen sin parar durante
años, aprendiendo miles de habilidades o funciones
acceso y propiedad de los datos en línea, y quién
obtendrá sus beneficios? Actualmente, las corporaciones
recopilan muchos datos para usos específicos que
conducen a mejores ganancias, con poco o ningún motivo
16. E. Yaylali, JS Ivy, MDP parcialmente observables (POMDP):
Introducción y ejemplos. Enciclopedia de Investigación de Operaciones
y Ciencias de la Gestión (John Wiley, Nueva York, 2011).
17. W. Schultz, P. Dayan, PR Montague, Science 275, 1593–1599
(1997).
interrelacionadas dentro de una arquitectura general que para compartir datos. Sin embargo, los beneficios 18. C. Dwork, F. McSherry, K. Nissim, A. Smith, en Proceedings of the Third
Theory of Cryptography Conference, Nueva York, 4 a 7 de marzo de
permita que el sistema mejore su capacidad. aprender potenciales que la sociedad podría obtener, incluso a
2006, págs. 265–284.
una habilidad basándose en haber aprendido otra (26– partir de los datos en línea existentes, serían considerables 19. A. Blum, K. Ligett, A. Roth, J. ACM 20, (2013).
28). Otro aspecto de la analogía con los sistemas de si esos datos estuvieran disponibles para el bien público. 20. J. Duchi, MI Jordan, J. Wainwright, J. ACM 61, 1–57
aprendizaje natural sugiere la idea de un aprendizaje de Para ilustrar, considere un ejemplo simple de cómo la (2014).
21. L.-V. Balcan, A. Blum, S. Fine, Y. Mansour, Aprendizaje distribuido,
iniciativa mixta basado en equipos. Por ejemplo, mientras sociedad podría beneficiarse de los datos que ya están
complejidad de la comunicación y privacidad. Actas de la 29.ª Conferencia
que los sistemas de aprendizaje automático actuales en línea hoy en día mediante el uso de estos datos para sobre Teoría del Aprendizaje Computacional, Edimburgo, Reino Unido,
normalmente funcionan de forma aislada para analizar los disminuir el riesgo de propagación de una pandemia del 26 de junio al 1 de julio de 2012.
datos proporcionados, las personas a menudo trabajan global a partir de enfermedades infecciosas. Al combinar 22. Y. Zhang, J. Duchi, M. Jordan, M. Wainwright, en Avances en sistemas
de procesamiento de información neuronal 26, L. Bottou, C. Burges, Z.
en equipos para recopilar y analizar datos (por ejemplo, datos de ubicación de fuentes en línea (p. ej., datos de
Ghahramani, M. Welling, Eds. (Curran Associates, Red Hook, NY, 2014),
los biólogos han trabajado en equipos para recopilar y ubicación de teléfonos celulares, de transacciones con págs. 1–23.
analizar datos genómicos, reuniendo diversos experimentos tarjeta de crédito en tiendas minoristas y de cámaras de 23. Q. Berthet, P. Rigollet, Ann. Estadística 41, 1780–1815 (2013).
24. A. Kleiner, A. Talwalkar, P. Sarkar, MI Jordan, JR Stat. Soc.,
y perspectivas para avanzar en este difícil problema). Los seguridad en lugares públicos y edificios privados) con
B 76, 795–816 (2014).
nuevos métodos de aprendizaje automático capaces de datos médicos en línea (p. ej., admisiones a la sala de
25. M. Mahoney, encontrado. Aprendizaje automático de tendencias. 3, 123–224
trabajar en colaboración con humanos para analizar emergencias), sería Hoy sería factible implementar un (2011).
conjuntamente conjuntos de datos complejos podrían unir sistema simple para llamar a las personas de inmediato 26. T. Mitchell et al., Actas de la Vigésima Novena Conferencia sobre
las habilidades de las máquinas para descubrir sutiles si una persona con la que estuvieron en contacto cercano Inteligencia Artificial (AAAI-15), 25 al 30 de enero de 2015, Austin, TX.
regularidades estadísticas de conjuntos de datos masivos ayer acaba de ingresar en la sala de emergencias con
27. M. Taylor, P. Stone, J. Mach. Aprender. Res. 10, 1633–1685
con las habilidades de los humanos para aprovechar una enfermedad infecciosa, alertándolas sobre los (2009).
diversos conocimientos previos para generar explicaciones síntomas que deben observar y las precauciones que 28. S. Thrun, L. Pratt, Aprendiendo a aprender (Kluwer Academic Press,
plausibles. y sugerir nuevas hipótesis. Muchos resultados deben tomar. Aquí, claramente existe una tensión y una Boston, 1998).
29. L. Wehbe et al., PLOS ONE 9, e112575 (2014).
teóricos del aprendizaje automático se aplican a todos los compensación entre la privacidad personal y la salud
30. K. Xu et al., Actas de la 32.ª Conferencia Internacional sobre Aprendizaje
sistemas de aprendizaje, ya sean algoritmos informáticos, pública, y la sociedad en general debe tomar la decisión Automático, vol. 37, Lille, Francia, del 6 al 11 de julio de 2015, págs.
animales, organizaciones o evolución natural. A medida sobre cómo hacer esta compensación. Sin embargo, el 2048–2057.
que avanza el campo, podemos ver que la teoría y los punto más importante de este ejemplo es que, aunque los 31. D. Blei, Commun. ACM 55, 77–84 (2012).
algoritmos del aprendizaje automático proporcionan cada datos ya están en línea, actualmente no tenemos las AKINBOSTANCI
CRÉDITO:
ISTOCK/
leyes,
vez más modelos para comprender el aprendizaje en los sistemas costumbres, cultura o mecanismos para permitir
neuronales. 10.1126/ciencia.aaa8415

Aprendizaje automático: tendencias, perspectivas y perspectivas

MI Jordan y TM Mitchell
Ciencia 349 (6245), 255-260.

DOI: 10.1126/ciencia.aaa8415
HERRAMIENTAS DE ARTÍCULO
http://science.sciencemag.org/content/349/6245/255
RELACIONADO
CONTENIDO http://science.sciencemag.org/content/sci/349/6245/248.full http://
science.sciencemag.org/content/sci/349/6252/1064.3.full
REFERENCIAS
Este artículo cita 17 artículos, 3 de los cuales puede acceder de forma gratuita
http://science.sciencemag.org/content/349/6245/255#BIBL
PERMISOS
www.science
permissions
reprints-
http://
help/
and-
science.sciencema
Descargado
enero
http://
2019
de
28
de
el
El uso de este artículo está sujeto a los Términos de servicio
Science (ISSN impreso 0036-8075; ISSN en línea 1095-9203) es una publicación de la Asociación Estadounidense para el Avance de la Ciencia, 1200 New
York Avenue NW, Washington, DC 20005. 2017 © Los autores, algunos derechos reservados; Licenciatario exclusivo Asociación Americana para el Avance
de la Ciencia. No se reclaman las obras originales del gobierno de EE. UU. El título Science es una marca registrada de AAAS.

2015.machine Learning - Trends, Perspectives, and Prospects

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

2015.machine Learning - Trends, Perspectives, and Prospects

Cargado por

Copyright:

Formatos disponibles

Machine Translated by Google

A pesar de los desafíos prácticos, tenemos la esperanza REVISIÓN

*Autor correspondiente. Correo electrónico: jordan@cs.berkeley.edu (MIJ);

CIENCIA cienciamag.org 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 255

procedimiento, o un procedimiento basado en simulación.

Como campo de estudio, el aprendizaje automático se

Impulsores del progreso del aprendizaje automático

La última década ha visto un rápido crecimiento en la

anotación de reconocimiento de objetos es de R. Girshick.] mezclen computacional y estadístico.

256 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 cienciamag.org CIENCIA

A pájaro volador sobre a cuerpo de agua .

CIENCIA cienciamag.org 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 257

vida 0,02 vida. genético

0,02 Análisis informático

optimización o muestreo. datos de entrenamiento no indican directamente

258 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 cienciamag.org CIENCIA

CIENCIA cienciamag.org 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 259

tecnologías más transformadoras del siglo XXI.

HDFS, S3, Ceph, … Almacenamiento REFERENCIAS

260 17 DE JULIO DE 2015 • VOL 349 NÚMERO 6245 cienciamag.org CIENCIA

Aprendizaje automático: tendencias, perspectivas y perspectivas

Ciencia 349 (6245), 255-260.

El uso de este artículo está sujeto a los Términos de servicio

También podría gustarte