Está en la página 1de 5

Fake videos of real people -- and how to spot them

Supasorn Suwajanakorn por Mario De la Fuente

Miren estas imágenes.

Ahora, quiero que me digan qué Obama de aquí es real.

(Video) Barack Obama: Para ayudar a las familias a refinanciar sus hogares,

invertir en cosas como la fabricación de alta tecnología,

energía limpia

y la infraestructura que crea buenos empleos nuevos.

¿Alguien?

La respuesta es ninguno de ellos.

(Risa)

Ninguno de ellos es realmente real.

Así que déjenme decirles cómo llegamos aquí.

Mi inspiración para este trabajo, fue un proyecto destinado a preservar nuestra última
oportunidad de aprender sobre el Holocausto de los sobrevivientes

Se llama Nuevas Dimensiones en el Testimonio,

y te permite tener conversaciones interactivas

con un holograma de un verdadero sobreviviente del Holocausto.

(Video) Hombre: ¿Cómo sobreviviste al Holocausto?

(Video) Holograma: ¿Cómo sobreviví?

Sobreviví,

Creo que…,

porque la providencia me cuidaba

SS: Resulta que estas respuestas fueron pregrabadas en un estudio.

Sin embargo, el efecto es asombroso.

Te sientes tan conectado a la historia como a la persona.

Creo que hay algo especial en la interacción humana

Algo que la hace mucho más profunda

y personal
mucho más que lo que los libros, las conferencias o las películas nos podrían enseñar.

Entonces vi esto y comencé a preguntarme:

¿podemos crear un modelo como este para cualquier persona?

¿Un modelo que se ve, habla y actúa como ellos?

Así que me puse a pensar si esto podría realizarse

y finalmente se me ocurrió una nueva solución

que puede construir el modelo de una persona usando solamente:

fotos y videos existentes de esa persona.

Si puede aprovechar este tipo de información pasiva,

Es decir, fotos y videos que estén por ahí,

Sería la clave para recrear a cualquiera.

Por cierto, aquí está Richard Feynman,

que además de ser ganador del Premio Nobel de Física

también fue conocido como un maestro legendario.

No sería genial si pudiéramos traerlo de vuelta

para dar sus conferencias e inspirar a millones de niños,

quizás no solo en inglés sino en cualquier idioma?

¿O si pudiéramos pedir consejos a nuestros abuelos y escuchar esas palabras reconfortantes


incluso si ya no están con nosotros?

O tal vez usando esta herramienta, autores de libros, vivos o no, podría leer en voz alta todos sus
libros para cualquier persona interesada.

Las posibilidades creativas aquí son infinitas,

y para mí, eso es muy emocionante.

Y así es como hasta ahora funciona.

Primero, voy a presentar esta nueva técnica

que puede reconstruir un modelo de cara en 3D de alto detalle a partir de cualquier imagen sin
escanear en 3D a la persona.

Y aquí está el mismo modelo de salida desde diferentes puntos de vista.

Esto también funciona en videos,

ejecutando el mismo algoritmo en cada marco de video


y generar un modelo 3D en movimiento.

Y aquí está el mismo modelo de salida, desde diferentes ángulos.

Resulta que este problema es muy desafiante,

pero el truco clave es que vamos a analizar

una gran colección de fotos de la persona de antemano.

Para George W. Bush, solo debemos buscar en Google,

y a partir de eso, podemos construir un modelo promedio,

un modelo iterativo y refinado para recuperar la expresión

en detalles finos, como pliegues y arrugas.

Lo que es fascinante de esto

es que la colección de fotos puede provenir de tus fotos típicas.

Realmente no importa qué expresión estés haciendo

o donde tomaste esas fotos

Lo importante es que haya muchas de ellas.

Y todavía nos falta colorear aquí,

así que a continuación, desarrollamos una nueva técnica de mezcla

que mejora los métodos promedios

y produce texturas y colores faciales nítidos.

Y esto se puede hacer para cualquier expresión….

Ahora tenemos el control del modelo de una persona,

y la forma en que se controla, es mediante una secuencia de fotos estáticas.

Observen cómo las arrugas van y vienen, dependiendo de la expresión.

También podemos usar un video para conducir el modelo.

(Video) Daniel Craig: Correcto, pero de alguna manera,

hemos logrado atraer a algunas personas increíbles.

SS: Y aquí hay otra demostración divertida.

Entonces, lo que ven aquí son modelos controlables de personas que construí a partir de sus fotos
en Internet.

Ahora, si se transfiere el movimiento desde el video de entrada, en realidad podemos conducir a


toda esta fiesta.
George W. Bush: es un proyecto de ley difícil de aprobar, porque hay muchas partes móviles, y
los procesos legislativos pueden ser feos.

(Aplausos)

SS: Volviendo un poco al tema,

nuestro objetivo final, es más bien, capturar sus gestos

o la forma única en que cada una de estas personas habla y sonríe.

Entonces, para hacer eso, ¿podemos enseñarle a la computadora a imitar la forma en que alguien
habla solo mostrando el video de la persona?

Y lo que hice exactamente fue, dejé que una computadora mirara 14 horas de puro Barack Obama
dando direcciones.

Y esto es lo que podemos producir solamente con su audio.

(Video) BO: Los resultados son claros. Las empresas de América han creado 14,5 millones de
nuevos puestos de trabajo en más de 75 meses consecutivos.

SS: Entonces, lo que se sintetiza aquí es solo la región de la boca,

y así es como lo hacemos.

Nuestro método utiliza una red neuronal para convertir e ingresar audio en estos puntos de boca.

(Video) BO: lo conseguimos a través de nuestro trabajo o a través de Medicare o Medicaid.

SS: Entonces sintetizamos la textura, mejoramos los detalles, los dientes, y lo mezclamos con la
cabeza y el fondo de una video fuente.

(Video) BO: Las mujeres pueden obtener chequeos gratis,

y no se te puede cobrar más solo por ser mujer.

Los jóvenes pueden permanecer en el plan de un padre hasta que cumplan 26.

SS: Creo que estos resultados parecen muy realistas e intrigantes,

pero al mismo tiempo resulta aterrador, incluso para mí.

Nuestro objetivo era construir un modelo preciso de una persona, no tergiversarlos.

Pero una cosa que me preocupa es su potencial de uso indebido.

La gente ha estado pensando en este problema durante mucho tiempo,

desde los días en que Photoshop llegó al mercado por primera vez.
Como investigador, también estoy trabajando en la tecnología de contramedidas,

y soy parte de un esfuerzo continuo en “AI Foundation”,

que usa una combinación de aprendizaje automático y moderadores humanos

para detectar imágenes y videos falsos,

luchando contra mi propio trabajo.

Y una de las herramientas que planeamos lanzar se llama “Reality Defender”,

que es un complemento para el navegador web que puede marcar contenido potencialmente
falso automáticamente, directamente desde el navegador.

(Aplausos)

A pesar de todo esto, sin embargo,

Los videos falsos podrían hacer mucho daño,

incluso antes de que alguien tenga la oportunidad de verificar,

así que es muy importante que todos seamos conscientes de lo que es actualmente posible para
que podamos tener la suposición correcta y ser críticos sobre lo que vemos.

Todavía queda un largo camino por recorrer antes de que podamos modelar por completo a las
personas individuales

y antes de que podamos garantizar la seguridad de esta tecnología.

Pero estoy emocionado y esperanzado,

porque si lo usamos bien y con cuidado,

esta herramienta puede permitir el impacto positivo de cualquier individuo en el mundo

ser escalado masivamente y realmente ayudar a dar forma a nuestro futuro de la manera que
queremos que sea.

Gracias.

(Aplausos)

También podría gustarte