Documentos de Académico
Documentos de Profesional
Documentos de Cultura
George Musser
Escritor colaborador
29 de enero de 2018
Hoy el mashup de los dos parece ser lo más natural del mundo. Las redes neuronales y otros
sistemas de aprendizaje automático se han convertido en la tecnología más disruptiva del
siglo XXI. Son seres humanos no humanos, que nos golpean no solo en tareas que la mayoría
de nosotros nunca fueron realmente buenos, como el ajedrez y la minería de datos, sino
también en el tipo de cosas para las que evolucionaron nuestros cerebros, como el
reconocimiento de caras, la traducción de idiomas y negociando paradas de cuatro vías. Estos
sistemas han sido posibles gracias a la gran potencia de cómputo, por lo que era inevitable
que las compañías tecnológicas buscaran computadoras que no fueran solo más grandes, sino
una nueva clase de máquina en total.
E N E S T A S E R I E
Sin embargo, nada con la palabra "cuántico" en él es más de lo que parece. Aunque podría
pensar que un sistema de aprendizaje automático cuántico debería ser poderoso, sufre de una
especie de síndrome cerrado. Opera en estados cuánticos, no en datos legibles por humanos,
y la traducción entre los dos puede negar sus ventajas aparentes. Es como un iPhone X que, a
pesar de sus impresionantes especificaciones, termina siendo tan lento como su teléfono
anterior, porque su red es tan horrible como siempre. Para algunos casos especiales, los
físicos pueden superar este cuello de botella insumo-producto, pero aún se desconoce si esos
casos surgen en tareas prácticas de aprendizaje automático. "Todavía no tenemos respuestas
claras", dijo Scott Aaronson., un científico informático de la Universidad de Texas, Austin,
que siempre es la voz de la sobriedad en lo que respecta a la informática cuántica. "La gente a
menudo ha sido muy arrogante sobre si estos algoritmos dan una aceleración".
Neuronas cuánticas
En una computadora clásica, todas estas interconexiones están representadas por una matriz
descomunal de números, y ejecutar la red significa hacer álgebra
matricial. Convencionalmente, estas operaciones matriciales se subcontratan a un chip
especializado, como una unidad de procesamiento de gráficos. Pero nada hace matrices como
una computadora cuántica. "La manipulación de grandes matrices y vectores grandes es
exponencialmente más rápida en una computadora cuántica", dijo Seth Lloyd , físico del
Instituto de Tecnología de Massachusetts y pionero de la computación cuántica.
Para esta tarea, las computadoras cuánticas pueden aprovechar la naturaleza exponencial de
un sistema cuántico. La mayor parte de la capacidad de almacenamiento de información de
un sistema cuántico reside no en sus unidades de datos individuales, sus qubits, la
contraparte cuántica de los bits de computadora clásicos, sino en las propiedades colectivas
de esos qubits. Dos qubits tienen cuatro estados conjuntos: ambos activados, desactivados,
activados / desactivados y desactivados / activados. Cada uno tiene una cierta ponderación, o
"amplitud", que puede representar una neurona. Si agrega un tercer qubit, puede representar
ocho neuronas; un cuarto, 16. La capacidad de la máquina crece exponencialmente. En efecto,
las neuronas están untadas por todo el sistema. Cuando actúa sobre un estado de cuatro
qubits, está procesando 16 números de un golpe, mientras que una computadora clásica
debería pasar por esos números uno por uno.
Lloyd estima que 60 qubits serían suficientes para codificar una cantidad de datos
equivalente a la producida por la humanidad en un año, y 300 podrían contener el contenido
de información clásica del universo observable. (Las computadoras cuánticas más grandes en
este momento, construidas por IBM, Intel y Google, tienen qubits de 50 ish.) Y eso es
asumiendo que cada amplitud es solo un bit clásico. De hecho, las amplitudes son cantidades
continuas (y, de hecho, números complejos) y, para una precisión experimental plausible,
uno podría almacenar hasta 15 bits, dijo Aaronson.
El dispositivo más grande, con unos 2.000 qubits, es el procesador cuántico fabricado por D-
Wave Systems, con sede cerca de Vancouver, Columbia Británica. No es lo que la mayoría de
la gente piensa como una computadora. En lugar de comenzar con algunos datos de entrada,
ejecutar una serie de operaciones y mostrar el resultado, funciona al encontrar consistencia
interna. Cada uno de sus qubits es un bucle eléctrico superconductor que actúa como un
pequeño electroimán orientado hacia arriba, hacia abajo o hacia arriba y hacia abajo, una
superposición. Los Qubits están "conectados" entre sí al permitirles interactuar
magnéticamente.
Hoja informativa
Obtenga la revista Quanta entregada a su bandeja de entrada
Suscríbase ahora
Boletín más reciente
Los procesadores fabricados por D-Wave Systems se están utilizando para aplicaciones de
aprendizaje automático.
Mwjohnson0
Para ejecutar el sistema, primero se impone un campo magnético horizontal, que inicializa los
qubits en una superposición igual de arriba y abajo, el equivalente de una pizarra en
blanco. Hay un par de formas de ingresar datos. En algunos casos, se fija una capa de qubits a
los valores de entrada deseados; más a menudo, incorporas la entrada en la fuerza de las
interacciones. Luego dejas que los qubits interactúen. Algunos buscan alinearse en la misma
dirección, algunos en la dirección opuesta, y bajo la influencia del campo horizontal, cambian
a su orientación preferida. Al hacerlo, pueden activar otros qubits para voltear. Inicialmente
eso sucede mucho, ya que muchos de ellos están desalineados. Con el tiempo, sin embargo, se
establecen, y puede desactivar el campo horizontal para bloquearlos en su lugar. En ese
punto,
No es del todo obvio cuál será la disposición final de los qubits, y ese es el punto. El sistema,
al hacer lo que surge de forma natural, es resolver un problema que una computadora
ordinaria tendría problemas. "No necesitamos un algoritmo", explicó Hidetoshi Nishimori ,
un físico del Instituto de Tecnología de Tokio que desarrolló los principios en los que operan
las máquinas D-Wave. "Es completamente diferente de la programación convencional. La
naturaleza resuelve el problema ".
El qubit-flipping es impulsado por el túnel cuántico, una tendencia natural que los sistemas
cuánticos tienen que buscar su configuración óptima, en lugar de conformarse con el segundo
mejor. Podrías construir una red clásica que funcionara según principios análogos, utilizando
jiggling aleatorios en lugar de tunelización para hacer que los bits se volteen y, en algunos
casos, funcionaría mejor. Pero, curiosamente, para los tipos de problemas que surgen en el
aprendizaje automático, la red cuántica parece alcanzar el óptimo más rápido.
El equipo asignó un qubit a cada cantidad. Si ese qubit se estableció en un valor de 1, marcó la
cantidad correspondiente como útil; 0 significa que no te molestes. Las interacciones
magnéticas de los qubits codificaban las demandas del problema, como incluir solo las
cantidades más discriminantes, a fin de mantener la selección final lo más compacta
posible. El resultado fue capaz de detectar un auto.
El año pasado, un grupo dirigido por Maria Spiropulu , física de partículas en el Instituto de
Tecnología de California, y Daniel Lidar , físico de USC, aplicaron el algoritmo a un problema
práctico de física: clasificación de colisiones de protones como "bosón de Higgs" o "sin bosón
de Higgs". . "Limitando su atención a las colisiones que escupían fotones, utilizaron la teoría
básica de partículas para predecir qué propiedades fotónicas podrían revelar la existencia
fugaz del Higgs, como el momento en exceso de algún umbral. Consideraron ocho de esas
propiedades y 28 combinaciones de las mismas, para un total de 36 señales candidatas, y
permitieron que una D-Wave de último modelo en la Universidad del Sur de California
encuentre la selección óptima. se identificó16 de las variables como útiles y tres como las
mejores absolutas. La máquina cuántica necesitaba menos datos que los procedimientos
estándar para realizar una identificación precisa. "Siempre que el conjunto de entrenamiento
fuera pequeño, entonces el enfoque cuántico proporcionó una ventaja de precisión sobre los
métodos tradicionales utilizados en la comunidad de física de alta energía", dijo Lidar.
Maria Spiropulu, una física del Instituto de Tecnología de California, utilizó el aprendizaje
cuántico automático para encontrar bosones de Higgs.
Cortesía de Maria Spiropulu
En diciembre, Rigetti demostró una forma de agrupar automáticamente objetos usando una
computadora cuántica de propósito general con 19 qubits. Los investigadores hicieron el
equivalente de alimentar a la máquina con una lista de ciudades y las distancias entre ellas, y
le pidieron que ordenara las ciudades en dos regiones geográficas. Lo que hace que este
problema sea difícil es que la designación de una ciudad depende de la designación de todas
las demás, por lo que debe resolver todo el sistema de una vez.
El equipo Rigetti efectivamente asignó a cada ciudad un qubit, indicando a qué grupo estaba
asignado. A través de las interacciones de los qubits (que, en el sistema de Rigetti, son
eléctricos en lugar de magnéticos), cada par de qubits buscaba tomar valores opuestos: su
energía se minimizaba cuando lo hacían. Claramente, para cualquier sistema con más de dos
qubits, algunos pares de qubits debían consentir en ser asignados al mismo grupo. Las
ciudades cercanas aceptaron más fácilmente ya que el costo energético para ellos para estar
en el mismo grupo era más bajo que para las ciudades más distantes.
Para conducir el sistema a su energía más baja, el equipo de Rigetti adoptó un enfoque
similar en algunos aspectos al anulador D-Wave. Inicializaron los qubits a una superposición
de todas las posibles asignaciones de clústeres. Permitieron que los qubits interactuaran
brevemente, lo que los predispuso a asumir los mismos valores u opuestos. Luego aplicaron el
análogo de un campo magnético horizontal, permitiendo que los qubits se volteen si estaban
tan inclinados, empujando el sistema un poco hacia su estado de energía más baja. Repitieron
este proceso de dos pasos: interactuar y luego voltear, hasta que el sistema redujo al mínimo
su energía, clasificando así las ciudades en dos regiones distintas.
Estas tareas de clasificación son útiles pero directas. La verdadera frontera del aprendizaje
automático está en los modelos generativos, que no solo reconocen cachorros y gatitos, sino
que también pueden generar arquetipos novedosos, animales que nunca existieron, pero que
son tan lindos como los que sí lo hicieron. Incluso pueden descubrir las categorías de "gatito"
y "cachorro" por su cuenta, o reconstruir imágenes que faltan una cola o una pata. "Estas
técnicas son muy poderosas y muy útiles en el aprendizaje automático, pero son muy
difíciles", dijo Mohammad Amin , científico jefe de D-Wave. Una asistencia cuántica sería
bienvenida.
D-Wave y otros equipos de investigación han asumido este desafío. Entrenar ese modelo
significa sintonizar las interacciones magnéticas o eléctricas entre los qubits para que la red
pueda reproducir algunos datos de muestra. Para hacer esto, combina la red con una
computadora ordinaria. La red hace el trabajo pesado, averiguando qué significa una
determinada opción de interacción para la configuración final de la red, y su computadora
asociada usa esta información para ajustar las interacciones. En una demostración el año
pasado, Alejandro Perdomo-Ortiz , un investigador del Laboratorio de Inteligencia Artificial
Cuántica de la NASA, y su equipo expusieron un sistema D-Wave a imágenes de dígitos
escritos a mano. Percibió que había 10 categorías, que coincidían con los dígitos del 0 al 9, y
generaba sus propios números garabateados.
Bueno, esas son las buenas noticias. Lo malo es que no importa cuán asombroso sea tu
procesador si no puedes ingresar tus datos. En los algoritmos de álgebra matricial, una sola
operación puede manipular una matriz de 16 números, pero aún se necesitan 16 operaciones
para cargar la matriz. "La preparación del estado, al poner los datos clásicos en un estado
cuántico, es completamente rechazada, y creo que esta es una de las partes más importantes",
dijo Maria Schuld, investigadora de la startup de computación cuántica Xanadu y una de las
primeras personas en recibir un doctorado en el aprendizaje automático cuántico. Los
sistemas de aprendizaje automático que se presentan en forma física enfrentan dificultades
paralelas para integrar un problema en una red de qubits y lograr que los qubits interactúen
como deberían.
Una vez que logra ingresar sus datos, debe almacenarlos de tal forma que un sistema cuántico
pueda interactuar con ellos sin colapsar el cálculo en curso. Lloyd y sus colegas han propuesto
una RAM cuántica que usa fotones, pero nadie tiene un artilugio análogo para los qubits
superconductores o iones atrapados, las tecnologías que se encuentran en las principales
computadoras cuánticas. "Es un gran problema tecnológico adicional más allá del problema
de construir una computadora cuántica", dijo Aaronson. "La impresión que recibo de los
experimentales con los que hablo es que están asustados. No tienen idea de cómo comenzar a
construir esto ".
Y finalmente, ¿cómo saca sus datos? Eso significa medir el estado cuántico de la máquina, y
no solo una medición devuelve un solo número a la vez, dibujado al azar, sino que colapsa
todo el estado, borrando el resto de los datos incluso antes de que tenga la oportunidad de
recuperarlos. eso. Tendría que ejecutar el algoritmo una y otra vez para extraer toda la
información.
Sin embargo, no todo está perdido. Para algunos tipos de problemas, puede aprovechar la
interferencia cuántica. Es decir, puede coreografiar las operaciones para que las respuestas
incorrectas se cancelen y las correctas se refuercen; de esa manera, cuando vayas a medir el
estado cuántico, no te dará ningún valor aleatorio, sino la respuesta deseada. Pero solo unos
pocos algoritmos, como la búsqueda de fuerza bruta, pueden hacer un buen uso de la
interferencia, y la aceleración suele ser modesta.
En algunos casos, los investigadores encontraron atajos para ingresar y sacar datos. En 2015
Lloyd, Silvano Garnerone de la Universidad de Waterloo en Canadá y Paolo Zanardi en USC
mostraron que, para algunos tipos de análisis estadístico, no es necesario ingresar o
almacenar todo el conjunto de datos. Del mismo modo, no es necesario que lea todos los
datos cuando basten algunos valores clave. Por ejemplo, las empresas de tecnología usan el
aprendizaje automático para sugerir espectáculos para mirar o cosas para comprar basadas
en una matriz enorme de hábitos de consumo. "Si eres Netflix o Amazon o lo que sea, en
realidad no necesitas la matriz escrita en cualquier lugar", dijo Aaronson. "Lo que realmente
necesitas es generar recomendaciones para un usuario".
Todo esto invita a la pregunta: si una máquina cuántica es poderosa solo en casos especiales,
¿podría una máquina clásica ser también poderosa en esos casos? Esta es la principal
pregunta no resuelta del campo. Las computadoras ordinarias son, después de todo,
extremadamente capaces. El método habitual de elección para manejar grandes conjuntos de
datos, el muestreo aleatorio, es en realidad muy similar en espíritu a una computadora
cuántica, que, independientemente de lo que ocurra dentro de ella, termina arrojando un
resultado aleatorio. Schuld comentó: "He hecho muchos algoritmos donde sentí, 'Esto es
increíble. Tenemos esta aceleración, "y luego en realidad, solo por diversión, escribo una
técnica de muestreo para una computadora clásica, y me doy cuenta de que puedes hacer lo
mismo con el muestreo".
Si mira hacia atrás en los éxitos que el aprendizaje cuántico de máquinas ha tenido hasta
ahora, todos vienen con asteriscos. Tome la máquina D-Wave. Al clasificar imágenes de
automóviles y bosones de Higgs, no fue más rápido que una máquina clásica. "Una de las
cosas de las que no hablamos en este documento es la aceleración cuántica", dijo Alex Mott,
un científico informático de Google DeepMind que fue miembro del equipo de investigación
de Higgs. Los enfoques de matriz-álgebra, como el algoritmo Harrow-Hassidim-Lloyd,
muestran una aceleración solo si las matrices son dispersas, en su mayoría llenas de
ceros. "Nadie pregunta, ¿son escasos los conjuntos de datos realmente interesantes en el
aprendizaje automático?", Señaló Schuld.
Inteligencia Cuántica
Por otro lado, incluso la mejora gradual ocasional sobre las técnicas existentes haría felices a
las compañías tecnológicas. "Estas ventajas que termina viendo, son modestas; no son
exponenciales, pero son cuadráticos ", dijo Nathan Wiebe , un investigador de computación
cuántica de Microsoft Research. "Con una computadora cuántica lo suficientemente grande y
rápida, podríamos revolucionar muchas áreas del aprendizaje automático". Y durante el uso
de los sistemas, los científicos informáticos podrían resolver el rompecabezas teórico de si
son intrínsecamente más rápidos y para qué.
R EL AC IO N AD O :
Así como muchos neurocientíficos ahora piensan que la estructura del pensamiento humano
refleja los requisitos de tener un cuerpo, también lo son los sistemas de aprendizaje
automático incorporados. Las imágenes, el lenguaje y la mayoría de los datos que fluyen a
través de ellos provienen del mundo físico y reflejan sus cualidades. El aprendizaje
automático cuántico está encarnado de manera similar, pero en un mundo más rico que el
nuestro. La única área donde sin dudas brillará es en el procesamiento de datos que ya son
cuánticos. Cuando los datos no son una imagen, sino el producto de un experimento de física
o química, la máquina cuántica estará en su elemento. El problema de entrada desaparece y
las computadoras clásicas se quedan en el polvo.
Las redes neuronales y los procesadores cuánticos tienen una cosa en común: es increíble que
funcionen en absoluto. Nunca fue obvio que pudieras entrenar una red, y durante décadas la
mayoría de la gente dudaba de que alguna vez fuera posible. Del mismo modo, no es obvio
que la física cuántica pueda ser utilizada para la computación, ya que los efectos distintivos de
la física cuántica están tan bien ocultos para nosotros. Y, sin embargo, ambos funcionan, no
siempre, pero con más frecuencia de la que teníamos derecho a esperar. Sobre este
precedente, parece probable que su unión también encuentre su lugar.