Documentos de Académico
Documentos de Profesional
Documentos de Cultura
2015.machine Learning - Trends, Perspectives, and Prospects
2015.machine Learning - Trends, Perspectives, and Prospects
tratamiento de datos personales y a la libre circulación de dichos datos problema de mejorar alguna medida del desempeño de aprendizaje es mejorar la precisión de esa función, con
(Reglamento general de protección de datos), COM(2012) 11 definitiva experiencia que consiste en una muestra de pares de entrada-
(2012); http://bit.ly/1Lu5POv. 1
Departamento de Ingeniería Eléctrica y Ciencias de la Computación, Departamento salida conocidos de la función. En algunos casos, la función
28. M. Schrems contra Facebook Ireland Limited, §J. datos ilegítimos de Estadística, Universidad de California, Berkeley, CA, EE. UU.
se representa explícitamente como una forma funcional
transmisión a EE. UU. (“PRISM”), ¶166 y 167 (2013); www.europe-v- 2
Departamento de aprendizaje automático, Carnegie
facebook.org/sk/sk_en.pdf. parametrizada; en otros casos, la función es implícita y se
Universidad de Mellon, Pittsburgh, Pensilvania, Estados Unidos.
science.sciencema
Descargado
enero
http://
2019
de
28
de
el gafas de sol 0.52
de un rendimiento. métrica (7, 8).
limón 0.86 estrella de mar 0.67 utilizados en estos múltiples campos para estudiar sistemas
que mejoran con la experiencia.
consideraciones, pero el problema va más allá del mero trabajar en algoritmos de aprendizaje automático, teoría y árboles de decisión, bosques de decisión, regresión
tamaño de los conjuntos de datos modernos; es la práctica. logística, máquinas de vectores de soporte, redes
naturaleza granular y personalizada de gran parte de estos neuronales, máquinas kernel y clasificadores bayesianos
datos. Los dispositivos móviles y la computación integrada Métodos básicos y avances recientes (1). Se ha propuesto una variedad de algoritmos de
permiten recopilar grandes cantidades de datos sobre Los métodos de aprendizaje automático más utilizados son aprendizaje para estimar estos diferentes tipos de mapeos,
seres humanos individuales, y los algoritmos de aprendizaje los métodos de aprendizaje supervisado (1). Los sistemas y también existen procedimientos genéricos como boosting
automático pueden aprender de estos datos para personalizarlos.
de aprendizaje supervisado, incluidos los clasificadores de y aprendizaje de múltiples núcleos que combinan los
sus servicios a las necesidades y circunstancias spam de correo electrónico, los reconocedores de rostros resultados de múltiples algoritmos de aprendizaje.
de cada individuo. Además, estos servicios personalizados sobre imágenes y los sistemas de diagnóstico médico para Los procedimientos para aprender f de los datos a menudo
se pueden conectar, de modo que surge un servicio global pacientes, ejemplifican el problema de aproximación de hacen uso de ideas de la teoría de la optimización o del
que aprovecha la riqueza y diversidad de datos de muchas funciones discutido anteriormente, donde los datos de análisis numérico, con la forma específica de problemas
personas sin dejar de adaptarse a las necesidades y entrenamiento toman la forma de una colección de (x, y) de aprendizaje automático (p. ej., que la función objetivo o
circunstancias de cada uno. Se pueden encontrar instancias pares y el objetivo es producir una predicción y* en la función que se va a integrar es a menudo la suma de un
de esta tendencia hacia la captura y extracción de grandes respuesta a una consulta x*. Las entradas x pueden ser gran número de términos). impulsando innovaciones. Esta
cantidades de datos para mejorar los servicios y la vectores clásicos o pueden ser objetos más complejos diversidad de arquitecturas y algoritmos de aprendizaje
productividad en muchos campos del comercio, la ciencia como documentos, imágenes, secuencias de ADN o refleja las diversas necesidades de las aplicaciones, con
y el gobierno. Los registros médicos históricos se utilizan diferentes
gráficos. De manera similar, se han estudiado muchos tipos diferentes arquitecturas
de salida y. que capturan diferentes tipos de
para descubrir qué pacientes responderán mejor a qué Se ha avanzado mucho centrándose en el problema de estructuras matemáticas, ofrecen diferentes niveles de
tratamientos; los datos de tráfico históricos se utilizan para clasificación binaria simple en el que y toma uno de dos adaptabilidad a la visualización y explicación post-hoc, y
mejorar el control del tráfico y reducir la congestión; los valores (por ejemplo, "correo basura" o "no correo basura"), brindan diversas compensaciones entre la complejidad
datos históricos de delitos se utilizan para ayudar a ubicar pero también ha habido abundante investigación sobre computacional, la cantidad de datos y rendimiento.
a la policía local en lugares específicos en momentos problemas como la clasificación multiclase. (donde y toma
específicos; y se capturan y seleccionan grandes conjuntos una de las K etiquetas), clasificación multietiqueta (donde Un área de progreso de alto impacto en el aprendizaje
de datos experimentales para acelerar el progreso en y es etiquetada simultáneamente por varias de las K supervisado en los últimos años involucra las redes
biología, astronomía, neurociencia y otras ciencias etiquetas), problemas de clasificación (donde y proporciona profundas, que son redes multicapa de unidades de umbral,
empíricas intensivas en datos. Parece que estamos al un orden parcial en algún conjunto) y problemas generales cada una de las cuales calcula alguna función parametrizada
comienzo de una tendencia de décadas hacia la toma de de predicción estructurada (donde y es un objeto simple de sus entradas (9, 10). Los sistemas de aprendizaje
decisiones cada vez más intensiva en datos y basada en combinatorio como un gráfico, cuyos componentes pueden profundo utilizan algoritmos de optimización basados en
evidencia en muchos aspectos de la ciencia, el comercio y ser necesarios para satisfacer algún conjunto de gradientes para ajustar los parámetros a lo largo de una
el gobierno. restricciones). Un ejemplo del último problema es el red multicapa de este tipo en función de los errores en su
etiquetado de parte del discurso, donde el objetivo es salida. Aprovechando las modernas arquitecturas de
Con la creciente importancia de los datos a gran escala etiquetar simultáneamente cada palabra en una oración de cómputo en paralelo, como las unidades de procesamiento
en todas las áreas del esfuerzo humano, ha surgido una entrada x como un sustantivo, verbo o alguna otra parte de gráficos desarrolladas originalmente para videojuegos,
ola de nuevas demandas sobre los algoritmos de del discurso. El aprendizaje supervisado también incluye ha sido posible construir sistemas de aprendizaje profundo
aprendizaje automático subyacentes. Por ejemplo, grandes casos en los que y tiene componentes de valor real o una que contienen miles de millones de parámetros y que
conjuntos de datos requieren algoritmos computacionalmente mezcla de componentes discretos y de valor real. pueden entrenarse en las grandes colecciones de
manejables, los datos altamente personales plantean la imágenes, videos y voz. muestras disponibles en Internet.
science.sciencema
Descargado
enero
http://
2019
de
28
de
el necesidad de algoritmos que minimicen los efectos de
privacidad, y la disponibilidad de grandes cantidades de
datos sin etiquetar plantea el desafío de diseñar algoritmos
de aprendizaje para aprovecharlos. Las siguientes
Los sistemas de aprendizaje supervisado generalmente
forman sus predicciones a través de un mapeo aprendido
f(x), que produce una salida y para cada entrada x (o una
distribución de probabilidad sobre y dada x). Existen
Estos sistemas de aprendizaje profundo a gran escala han
tenido un efecto importante en los últimos años en la visión
por computadora (11) y el reconocimiento de voz (12),
donde han producido mejoras importantes en el rendimiento
secciones examinan algunos de los efectos de estas demandas muchas
en los últimos
formas diferentes de mapeo f, incluyendo con respecto a los enfoques anteriores.
Imagen de entrada Extracción de características convolucionales RNN con atención sobre la imagen Generación palabra
por palabra
pájaro
volador
LSTM sobre
un cuerpo
de
mapa de características de 14 x 14
agua
Fig. 2. Generación automática de leyendas de texto para imágenes con redes profundas. Se entrena una red neuronal convolucional para interpretar imágenes, y su
salida luego es utilizada por una red neuronal recurrente entrenada para generar una leyenda de texto (arriba). La secuencia en la parte inferior muestra el enfoque
palabra por palabra de la red en diferentes partes de la imagen de entrada mientras genera el título palabra por palabra. [Adaptado con permiso de (30)] CRÉDITO:
ISTOCK/
CORR
Temas Documentos
gen 0,04
adn 0,02 Proporciones
genético 0,01 temáticas y asignaciones
.,,
genes organismo genes
¿sobrevivir?
cerebro 0,04
neurona 0,02
nervio 0,01
.,,
predicciones
Figura 3. Modelos temáticos. El modelado de temas es una metodología para analizar documentos, donde un documento se ve como una colección de palabras, y
las palabras en el documento se ven como generadas por un conjunto subyacente de temas (indicados por los colores en la figura). Los temas son distribuciones de
probabilidad entre palabras (columna más a la izquierda), y cada documento se caracteriza por una distribución de probabilidad entre temas (histograma). Estas
distribuciones se infieren en función del análisis de una colección de documentos y se pueden ver para clasificar, indexar y resumir el contenido de los documentos. [De (31).
Copyright 2012, Association for Computing Machinery, Inc. Reimpreso con permiso]
(ver Fig. 2). Los métodos de redes profundas se están buscando se desarrollan ritmos para optimizar el criterio. La energía está entrenada para elegir acciones para cualquier
activamente en una variedad de aplicaciones adicionales, desde Como otro ejemplo, el agrupamiento es el problema de encontrar estado dado, con el objetivo de maximizar su recompensa
la traducción del lenguaje natural hasta el filtrado colaborativo. una partición de los datos observados (y una regla para predecir esperada con el tiempo. Los vínculos con la investigación en el control
datos futuros) en ausencia de etiquetas explícitas que indiquen la teoría y la investigación operativa han aumentado a lo largo
Se puede considerar que las capas internas de las redes una partición deseada. de los años, con formulaciones como los procesos de decisión
profundas proporcionan representaciones aprendidas de los Se ha desarrollado una amplia gama de procedimientos de de Markov y los procesos de decisión de Markov parcialmente
science.sciencema
Descargado
enero
http://
2019
de
28
de
el datos de entrada. Si bien gran parte del éxito práctico en el
aprendizaje profundo proviene de los métodos de aprendizaje
supervisado para descubrir tales representaciones, también se
han hecho esfuerzos para desarrollar algoritmos de aprendizaje
agrupamiento, todos basados en supuestos específicos
relacionados con la naturaleza de un “conglomerado”. Tanto en
el agrupamiento como en la reducción de dimensiones, la
preocupación por la complejidad computacional es primordial,
observados que proporcionan puntos de contacto (15, 16). Los
algoritmos de aprendizaje por refuerzo generalmente hacen uso
de ideas que son familiares de la literatura de la teoría del
control, como la iteración de políticas, la iteración de valores, los
profundo que descubren representaciones útiles de la entrada dado que el objetivo es explotar los conjuntos de datos lanzamientos y la reducción de la varianza, con innovaciones
sin necesidad de etiquetar los datos de entrenamiento (13). . El particularmente grandes que están disponibles si se prescinde que surgen para abordar las necesidades específicas del
problema general se conoce como aprendizaje no supervisado, de las etiquetas supervisadas. aprendizaje automático (por ejemplo, problemas a gran escala). ,
un segundo paradigma en la investigación del aprendizaje Un tercer paradigma importante de aprendizaje automático pocas suposiciones sobre el entorno dinámico desconocido y el
automático (2). es el aprendizaje por refuerzo (14, 15). Aquí, la información uso de arquitecturas de aprendizaje supervisado para representar
En términos generales, el aprendizaje no supervisado disponible en los datos de entrenamiento es intermedia entre el políticas). También vale la pena señalar los fuertes vínculos
generalmente implica el análisis de datos no etiquetados bajo aprendizaje supervisado y no supervisado. En lugar de ejemplos entre el aprendizaje por refuerzo y muchas décadas de trabajo
suposiciones sobre las propiedades estructurales de los datos de entrenamiento que indiquen la salida correcta para una sobre el aprendizaje en psicología y neurociencia, un ejemplo
(por ejemplo, algebraicas, combinatorias o probabilísticas). Por entrada dada, se supone que los datos de entrenamiento en el notable es el uso de algoritmos de aprendizaje por refuerzo para
ejemplo, se puede suponer que los datos se encuentran en una aprendizaje por refuerzo proporcionan solo una indicación de si predecir la respuesta de las neuronas dopaminérgicas en monos
variedad de baja dimensión y apuntar a identificar esa variedad una acción es correcta o no; si una acción es incorrecta, queda que aprenden a asociar un estímulo de luz. con posterior
explícitamente a partir de los datos. Los métodos de reducción el problema de encontrar la acción correcta. Más generalmente, recompensa de azúcar (17).
de dimensiones, incluidos el análisis de componentes principales, en el establecimiento de secuencias de entradas, se supone
el aprendizaje múltiple, el análisis factorial, las proyecciones que las señales de recompensa se refieren a la secuencia
aleatorias y los codificadores automáticos (1, 2), hacen completa; la asignación de crédito o culpa a las acciones Aunque estos tres paradigmas de aprendizaje ayudan a
suposiciones específicas diferentes con respecto a la variedad individuales en la secuencia no se proporciona directamente. De organizar ideas, gran parte de la investigación actual implica
subyacente (por ejemplo, que es un subespacio lineal, un hecho, aunque se estudian versiones simplificadas del combinaciones entre estas categorías. Por ejemplo, el
subespacio suave). variedad no lineal, o una colección de aprendizaje por refuerzo conocidas como problemas de aprendizaje semisupervisado utiliza datos no etiquetados para
subvariedades). Otro ejemplo de reducción de dimensiones es bandidos, en las que se supone que se proporcionan aumentar los datos etiquetados en un contexto de aprendizaje
el marco de modelado de temas que se muestra en la figura 3. recompensas después de cada acción, los problemas de supervisado, y el entrenamiento discriminativo combina
aprendizaje por refuerzo suelen implicar un entorno teórico de arquitecturas desarrolladas para el aprendizaje no supervisado
Se define una función de criterio que incorpora control general en el que la tarea de aprendizaje es aprender con formulaciones de optimización que utilizan etiquetas. La
estos supuestos, a menudo haciendo uso de principios una estrategia de control. (una "política") para un agente que selección de modelos es la actividad amplia de usar datos de
estadísticos generales como la máxima verosimilitud, el método actúa en un entorno dinámico desconocido, donde esa estrategia entrenamiento no solo para ajustar un modelo sino también para
de los momentos o la integración bayesiana, y algoritmos de aprendida seleccionar de una familia de modelos, y el hecho de que los
AKINBOSTANCI
CRÉDITO:
ISTOCK/
qué modelo usar conduce al uso de algoritmos desarrollados vacío La privacidad se puede formalizar a través de la revelan la mayor parte de su genoma en el contexto de la
para problemas de bandidos y a procedimientos de noción de "privacidad diferencial", que define un canal investigación de una enfermedad que corre en su familia,
optimización bayesianos. El aprendizaje activo surge probabilístico entre los datos y el mundo exterior, de modo pero pueden solicitar una protección más estricta si la
cuando al alumno se le permite elegir puntos de datos y que un observador de la salida del canal no puede inferir de información sobre su genoma se utiliza para establecer las
consultar al entrenador para solicitar información específica, forma fiable si determinados individuos han proporcionado tarifas del seguro.
como la etiqueta de un ejemplo no etiquetado de otro modo. datos o no (18). . Las aplicaciones clásicas de la privacidad La comunicación es otro recurso que necesita
El modelado causal es el esfuerzo por ir más allá del simple diferencial implican asegurar que las consultas (p. ej., "¿cuál ser administrado dentro del contexto general de un sistema
descubrimiento de relaciones predictivas entre variables, es el saldo máximo en un conjunto de cuentas?") a una de aprendizaje distribuido. Por ejemplo, los datos pueden
para distinguir qué variables influyen causalmente en otras base de datos privatizada arrojan una respuesta cercana a estar distribuidos en distintas ubicaciones físicas porque su
(p. ej., un recuento alto de glóbulos blancos puede predecir la que arrojan los datos no privados. tamaño no les permite
la existencia de una infección, pero es la infección la que agregarse en un solo sitio o debido a los límites
causa el alto número de glóbulos blancos). recuento de Investigaciones recientes han puesto en contacto la administrativos. En tal entorno, es posible que deseemos
glóbulos blancos). Muchos problemas influyen en el diseño privacidad diferencial con el aprendizaje automático, donde imponer una restricción de comunicación de tasa de bits en
de los algoritmos de aprendizaje en todos estos paradigmas, las consultas implican predicciones u otras afirmaciones el algoritmo de aprendizaje automático. Resolver el problema
incluido si los datos están disponibles en lotes o si llegan inferenciales (p. ej., "dados los datos que he visto hasta de diseño bajo tal restricción generalmente mostrará cómo
secuencialmente a lo largo del tiempo, cómo se han ahora, ¿cuál es la probabilidad de que una nueva transacción se degrada el rendimiento del sistema de aprendizaje con
muestreado los datos, los requisitos de que los usuarios sea fraudulenta?") (19, 20). Situar el diseño general de un la disminución del ancho de banda de comunicación, pero
puedan interpretar los modelos aprendidos y los problemas sistema de aprendizaje automático que mejora la privacidad también puede revelar cómo mejora el rendimiento a medida
de solidez que surgen cuando los datos. no se ajustan a las dentro de un marco teórico de decisiones proporciona a los que aumenta el número de sitios distribuidos (p. ej.,
suposiciones de modelos anteriores. usuarios una perilla de ajuste mediante la cual pueden elegir máquinas o procesadores). aumenta, compensando estas
el nivel deseado de privacidad que tiene en cuenta los tipos cantidades con la cantidad de datos (21, 22). Al igual que
Tendencias emergentes de preguntas que se le harán a los datos y su propia utilidad en la teoría clásica de la información, esta línea de
El campo del aprendizaje automático es lo suficientemente personal para las respuestas. Por ejemplo, una persona investigación tiene como objetivo los límites inferiores
joven como para expandirse rápidamente, a menudo puede estar dispuesta a fundamentales del rendimiento alcanzable y los algoritmos
mediante la invención de nuevas formalizaciones de específicos que logran esos límites inferiores.
problemas de aprendizaje automático impulsadas por
aplicaciones prácticas. (Un ejemplo es el desarrollo de Un objetivo principal de esta línea general de investigación
sistemas de recomendación, como se describe en la Fig. es poner en contacto los tipos de recursos estadísticos
4). Una tendencia importante que impulsa esta expansión estudiados en el aprendizaje automático (por ejemplo, la
es una creciente preocupación por el entorno en el que cantidad de puntos de datos, la dimensión de un parámetro
opera un algoritmo de aprendizaje automático. La palabra y la complejidad de una clase de hipótesis) con los recursos
"entorno" aquí se refiere en parte a la arquitectura computacionales clásicos del tiempo. y espacio Tal puente
informática; Mientras que un sistema de aprendizaje está presente en el marco de aprendizaje "probablemente
automático clásico implicaba un solo programa que se aproximadamente correcto" (PAC), que estudia el efecto de
ejecutaba en una sola máquina, ahora es común que los agregar una restricción de cálculo de tiempo polinomial en
sistemas de aprendizaje automático se implementen en esta relación entre las tasas de error, el tamaño de los datos
arquitecturas que incluyen muchos miles o decenas de miles de entrenamiento y otros parámetros del algoritmo de
science.sciencema
Descargado
enero
http://
2019
de
28
de
el de procesadores, de modo que las limitaciones de
comunicación y las cuestiones de paralelismo y
procesamiento distribuido ocupan un lugar central. De
hecho, como se muestra en la figura 5, los sistemas de
aprendizaje ( 3). Los avances recientes en esta línea de
investigación incluyen varios límites inferiores que establecen
brechas fundamentales en el rendimiento alcanzable en
ciertos problemas de aprendizaje automático (p. ej.,
aprendizaje automático adoptan cada vez más la forma de regresión dispersa y análisis de componentes principales
colecciones complejas de software que se ejecutan en dispersas) a través de algoritmos de tiempo polinomial y
plataformas informáticas paralelas y distribuidas a gran tiempo exponencial (23). El núcleo del problema, sin
escala y proporcionan una variedad de algoritmos y servicios a los analistas de datos. embargo, involucra compensaciones de datos de tiempo
La palabra "entorno" también se refiere a la fuente de los que están lejos del límite polinomial/exponencial. Los
datos, que va desde un conjunto de personas que pueden grandes conjuntos de datos que son cada vez más la norma
tener preocupaciones sobre la privacidad o la propiedad, requieren algoritmos cuyos requisitos de tiempo y espacio
hasta el analista o la persona que toma las decisiones, que sean lineales o sublineales en el tamaño del problema
puede tener ciertos requisitos en un sistema de aprendizaje (número de puntos de datos o número de dimensiones). Las
automático (por ejemplo, ejemplo, que su salida sea investigaciones recientes se centran en métodos como el
visualizable), y al marco social, legal o político que rodea el submuestreo, las proyecciones aleatorias y el debilitamiento
despliegue de un sistema. de algoritmos para lograr escalabilidad manteniendo el
El entorno también puede incluir otros sistemas de control estadístico (24, 25).
aprendizaje automático u otros agentes, y la colección El objetivo final es poder proporcionar presupuestos de
general de sistemas puede ser cooperativa o adversaria. tiempo y espacio a los sistemas de aprendizaje automático
En términos generales, los entornos proporcionan varios Fig. 4. Sistemas de recomendación. Un sistema de además de los requisitos de precisión, con el sistema
recursos a un algoritmo de aprendizaje y imponen recomendación es un sistema de aprendizaje automático encontrando un punto operativo que permita cumplir dichos
restricciones a esos recursos. Cada vez más, los que se basa en datos que indican vínculos entre un requisitos.
investigadores de aprendizaje automático están formalizando conjunto de usuarios (p. ej., personas) y un conjunto de
estas relaciones, con el objetivo de diseñar algoritmos que elementos (p. ej., productos). Un enlace entre un usuario Oportunidades y desafíos
sean demostrablemente efectivos en varios entornos y y un producto significa que el usuario ha mostrado interés en A pesar de sus éxitos prácticos y comerciales, el aprendizaje
permitan explícitamente a los usuarios expresar y controlar el producto de alguna manera (quizás comprando ese automático sigue siendo un campo joven con muchas
las compensaciones entre los recursos. artículo en el pasado). El problema del aprendizaje oportunidades de investigación poco exploradas.
Como ejemplo de limitaciones de recursos, supongamos automático es sugerir otros artículos a un usuario Algunas de estas oportunidades se pueden ver al contrastar
que los datos son proporcionados por un conjunto de determinado que también le pueden interesar, según los los enfoques actuales de aprendizaje automático con los
personas que desean conservar un grado de privilegiado. datos de todos los usuarios. tipos de aprendizaje que observamos en forma natural. CRÉDITO:
ISTOCK/
CORR
Aplicaciones internas
la sociedad se beneficie de ellos, si así lo desea.
Genómica del cáncer, depuración energética, edificios inteligentes
De hecho, gran parte de estos datos son de propiedad
muestra limpia G-OLA ML Base privada, a pesar de que son datos sobre cada uno de
Acceso e nosotros. Consideraciones como estas sugieren que es
BlinkDB interfaces probable que el aprendizaje automático sea una de las
SparkR GráficoX
Chapoteo
MLPiplines velox
transmisión
chispas
de
Sucinto
que se crean en plataformas informáticas paralelas y distribuidas. La arquitectura que se muestra aquí, una pila de (2000).
6. S. Shalev-Shwartz, O. Shamir, E. Tromer, Using more data to speed up
análisis de datos de código abierto desarrollada en el Laboratorio de Algoritmos, Máquinas y Personas (AMP) de
training time, Proceedings of the Fifteenth Conference on Artificial
la Universidad de California, Berkeley, incluye capas que interactúan con los sistemas operativos subyacentes; Intelligence and Statistics, Islas Canarias, España, 21 al 23 de abril de
capas que proporcionan almacenamiento distribuido, gestión y procesamiento de datos; y capas que brindan 2012.
7. S. Boyd, N. Parikh, E. Chu, B. Peleato, J. Eckstein, en
competencias básicas de aprendizaje automático, como transmisión, submuestreo, canalizaciones, procesamiento
Foundations and Trends in Machine Learning 3 (Now
de gráficos y servicio de modelos.
Publishers, Boston, 2011), págs. 1–122.
8. S. Sra, S. Nowozin, S. Wright, Optimización para el aprendizaje
sistemas que ocurren como humanos y otros animales, organizaciones y la evolución biológica y ver el aprendizaje
automático (MIT Press, Cambridge, MA, 2011). 9.
organizaciones, economías y evolución biológica. Por automático beneficiarse de los estudios en curso de estos J. Schmidhuber, Neural Netw. 61, 85–117 (2015).
ejemplo, mientras que la mayoría de los algoritmos de otros tipos de sistemas de aprendizaje. 10. Y. Bengio, en Fundamentos y tendencias del aprendizaje automático 2
aprendizaje automático están destinados a aprender una Al igual que con cualquier tecnología poderosa, el (Now Publishers, Boston, 2009), págs. 1–127.
11. A. Krizhevsky, I. Sutskever, G. Hinton, Adv. Información neuronal Proceso.
función específica o un modelo de datos de una sola aprendizaje automático plantea preguntas sobre cuáles
sist. 25, 1097–1105 (2015).
fuente de datos, los humanos claramente aprenden de sus usos potenciales la sociedad debería alentar y 12. G. Hinton et al., IEEE Signal Process. revista 29, 82–97
muchas habilidades y tipos de conocimiento diferentes, a desalentar. El impulso de los últimos años para recopilar (2012).
13. GE Hinton, RR Salakhutdinov, Science 313, 504–507
partir de años de experiencia de capacitación diversa, nuevos tipos de datos personales, motivado por su valor
(2006).
supervisada y no supervisada, de una manera simple. económico, conduce a problemas de privacidad obvios,
14. V. Mnih et al., Nature 518, 529–533 (2015).
Secuencia de -a-más-difícil (p. ej., aprender a gatear, como se mencionó anteriormente. El creciente valor de 15. RS Sutton, AG Barto, Aprendizaje por refuerzo: una
luego a caminar, luego a correr). Esto ha llevado a los datos también plantea una segunda cuestión ética: ¿Quién tendrá
introducción (MIT Press, Cambridge, MA, 1998).
science.sciencema
Descargado
enero
http://
2019
de
28
de
el algunos investigadores a comenzar a explorar la cuestión
de cómo construir una computadora con estudiantes
permanentes o interminables que operen sin parar durante
años, aprendiendo miles de habilidades o funciones
acceso y propiedad de los datos en línea, y quién
obtendrá sus beneficios? Actualmente, las corporaciones
recopilan muchos datos para usos específicos que
conducen a mejores ganancias, con poco o ningún motivo
16. E. Yaylali, JS Ivy, MDP parcialmente observables (POMDP):
Introducción y ejemplos. Enciclopedia de Investigación de Operaciones
y Ciencias de la Gestión (John Wiley, Nueva York, 2011).
17. W. Schultz, P. Dayan, PR Montague, Science 275, 1593–1599
(1997).
interrelacionadas dentro de una arquitectura general que para compartir datos. Sin embargo, los beneficios 18. C. Dwork, F. McSherry, K. Nissim, A. Smith, en Proceedings of the Third
Theory of Cryptography Conference, Nueva York, 4 a 7 de marzo de
permita que el sistema mejore su capacidad. aprender potenciales que la sociedad podría obtener, incluso a
2006, págs. 265–284.
una habilidad basándose en haber aprendido otra (26– partir de los datos en línea existentes, serían considerables 19. A. Blum, K. Ligett, A. Roth, J. ACM 20, (2013).
28). Otro aspecto de la analogía con los sistemas de si esos datos estuvieran disponibles para el bien público. 20. J. Duchi, MI Jordan, J. Wainwright, J. ACM 61, 1–57
aprendizaje natural sugiere la idea de un aprendizaje de Para ilustrar, considere un ejemplo simple de cómo la (2014).
21. L.-V. Balcan, A. Blum, S. Fine, Y. Mansour, Aprendizaje distribuido,
iniciativa mixta basado en equipos. Por ejemplo, mientras sociedad podría beneficiarse de los datos que ya están
complejidad de la comunicación y privacidad. Actas de la 29.ª Conferencia
que los sistemas de aprendizaje automático actuales en línea hoy en día mediante el uso de estos datos para sobre Teoría del Aprendizaje Computacional, Edimburgo, Reino Unido,
normalmente funcionan de forma aislada para analizar los disminuir el riesgo de propagación de una pandemia del 26 de junio al 1 de julio de 2012.
datos proporcionados, las personas a menudo trabajan global a partir de enfermedades infecciosas. Al combinar 22. Y. Zhang, J. Duchi, M. Jordan, M. Wainwright, en Avances en sistemas
de procesamiento de información neuronal 26, L. Bottou, C. Burges, Z.
en equipos para recopilar y analizar datos (por ejemplo, datos de ubicación de fuentes en línea (p. ej., datos de
Ghahramani, M. Welling, Eds. (Curran Associates, Red Hook, NY, 2014),
los biólogos han trabajado en equipos para recopilar y ubicación de teléfonos celulares, de transacciones con págs. 1–23.
analizar datos genómicos, reuniendo diversos experimentos tarjeta de crédito en tiendas minoristas y de cámaras de 23. Q. Berthet, P. Rigollet, Ann. Estadística 41, 1780–1815 (2013).
24. A. Kleiner, A. Talwalkar, P. Sarkar, MI Jordan, JR Stat. Soc.,
y perspectivas para avanzar en este difícil problema). Los seguridad en lugares públicos y edificios privados) con
B 76, 795–816 (2014).
nuevos métodos de aprendizaje automático capaces de datos médicos en línea (p. ej., admisiones a la sala de
25. M. Mahoney, encontrado. Aprendizaje automático de tendencias. 3, 123–224
trabajar en colaboración con humanos para analizar emergencias), sería Hoy sería factible implementar un (2011).
conjuntamente conjuntos de datos complejos podrían unir sistema simple para llamar a las personas de inmediato 26. T. Mitchell et al., Actas de la Vigésima Novena Conferencia sobre
las habilidades de las máquinas para descubrir sutiles si una persona con la que estuvieron en contacto cercano Inteligencia Artificial (AAAI-15), 25 al 30 de enero de 2015, Austin, TX.
regularidades estadísticas de conjuntos de datos masivos ayer acaba de ingresar en la sala de emergencias con
27. M. Taylor, P. Stone, J. Mach. Aprender. Res. 10, 1633–1685
con las habilidades de los humanos para aprovechar una enfermedad infecciosa, alertándolas sobre los (2009).
diversos conocimientos previos para generar explicaciones síntomas que deben observar y las precauciones que 28. S. Thrun, L. Pratt, Aprendiendo a aprender (Kluwer Academic Press,
plausibles. y sugerir nuevas hipótesis. Muchos resultados deben tomar. Aquí, claramente existe una tensión y una Boston, 1998).
29. L. Wehbe et al., PLOS ONE 9, e112575 (2014).
teóricos del aprendizaje automático se aplican a todos los compensación entre la privacidad personal y la salud
30. K. Xu et al., Actas de la 32.ª Conferencia Internacional sobre Aprendizaje
sistemas de aprendizaje, ya sean algoritmos informáticos, pública, y la sociedad en general debe tomar la decisión Automático, vol. 37, Lille, Francia, del 6 al 11 de julio de 2015, págs.
animales, organizaciones o evolución natural. A medida sobre cómo hacer esta compensación. Sin embargo, el 2048–2057.
que avanza el campo, podemos ver que la teoría y los punto más importante de este ejemplo es que, aunque los 31. D. Blei, Commun. ACM 55, 77–84 (2012).
algoritmos del aprendizaje automático proporcionan cada datos ya están en línea, actualmente no tenemos las AKINBOSTANCI
CRÉDITO:
ISTOCK/
leyes,
vez más modelos para comprender el aprendizaje en los sistemas costumbres, cultura o mecanismos para permitir
neuronales. 10.1126/ciencia.aaa8415
HERRAMIENTAS DE ARTÍCULO
http://science.sciencemag.org/content/349/6245/255
RELACIONADO
CONTENIDO http://science.sciencemag.org/content/sci/349/6245/248.full http://
science.sciencemag.org/content/sci/349/6252/1064.3.full
REFERENCIAS
Este artículo cita 17 artículos, 3 de los cuales puede acceder de forma gratuita
http://science.sciencemag.org/content/349/6245/255#BIBL
PERMISOS
www.science
permissions
reprints-
http://
help/
and-
science.sciencema
Descargado
enero
http://
2019
de
28
de
el
Science (ISSN impreso 0036-8075; ISSN en línea 1095-9203) es una publicación de la Asociación Estadounidense para el Avance de la Ciencia, 1200 New
York Avenue NW, Washington, DC 20005. 2017 © Los autores, algunos derechos reservados; Licenciatario exclusivo Asociación Americana para el Avance
de la Ciencia. No se reclaman las obras originales del gobierno de EE. UU. El título Science es una marca registrada de AAAS.