Está en la página 1de 17

MCS0010.

1177/01634437211036975Medios, cultura y sociedadBucher


artículo-de-investigación2022

Machine Translated by Google

Número especial: Recuperar lo humano en las culturas de las máquinas

Medios, Cultura y Sociedad


2022, vol. 44(4) 638–654
Enfrentando la IA: © El(los) autor(es) 2022

conceptualizando la
Pautas para la reutilización de

'comunicación fAIce' como el https://doi.org/10.1177/01634437211036975


artículos: sagepub.com/journals-permissions
DOI: 10.1177/01634437211036975

modus operandi de los sistemas de reconocimiento facial journals.sagepub.com/home/mcs

Taina Bucher
Universidad de Oslo, Noruega

Resumen

Este artículo aboga por la conceptualización de la comunicación facial como el modus operandi del reconocimiento
facial. Desde aplicaciones que afirman determinar la confiabilidad de una persona, tecnología de reclutamiento que
analiza la aptitud laboral de los candidatos, hasta bancos que utilizan el escaneo del iris para reemplazar las tarjetas
de débito, el reconocimiento facial se usa cada vez más para comunicar información sobre la identidad y la
personalidad de una persona. Las caras comunican y tienen mayor valor. Saber más acerca de cómo se efectúa y
materializa su capacidad comunicativa en la cultura de la máquina contemporánea es, por lo tanto, de mayor
importancia. El artículo pregunta cómo podríamos llegar a pensar en las capacidades comunicativas de los rostros
en aplicaciones de IA y cómo su papel en los sistemas biométricos actuales puede contribuir a reconfigurar nuestra
comprensión de lo que es la comunicación. En una era de sistemas algorítmicos y automatizados que no están
impulsados principalmente por mensajes abiertos creados por humanos a propósito, sino por máquinas que
ensamblan rastros de datos en formas significativas, las caras ya no son significativas (si es que alguna vez lo
fueron) solo para los humanos.

En última instancia, este artículo defiende la conceptualización del potencial comunicativo de los rostros en la cultura
de las máquinas en términos de lo que denomino trabajo facial algorítmico, o más coloquialmente, comunicación
facial.

Palabras clave
teoría de la comunicación, cara, facialidad, reconocimiento facial, comunicación hombre-máquina,
visión artificial, significado, aprendizaje automático

Autor correspondiente:
Taina Bucher, Departamento de Medios y Comunicación, Universidad de Oslo, PO Box 1093 Blindern, Oslo 0317,
Noruega.
Correo electrónico: taina.bucher@media.uio.no
Machine Translated by Google

Bucher 639

Introducción
Desde aplicaciones que afirman determinar la confiabilidad de una persona, tecnología de reclutamiento
que analiza la aptitud laboral de los candidatos, hasta bancos que utilizan el escaneo del iris para
reemplazar las tarjetas de débito, el reconocimiento facial se usa cada vez más para comunicar
información sobre la identidad y la personalidad de una persona. Las caras comunican y tienen mayor
valor. Saber más acerca de cómo se efectúa y materializa su capacidad comunicativa en la cultura de
la máquina contemporánea es, por lo tanto, de mayor importancia. En la teoría de la comunicación, la
cara se ve a menudo como el modo original de comunicación. Sin embargo, aún no se comprende
completamente cómo se comunica la cara dentro de la cultura de la máquina. Esto no quiere decir
que la cara no haya sido estudiada o teorizada a fondo. Todo lo contrario.
Los rostros ocupan un lugar destacado en una amplia gama de disciplinas, desde la historia del
arte hasta la fotografía, los estudios cinematográficos, los estudios de seguridad, la criminología, la
robótica y la psicología. Aquí, las conceptualizaciones del papel comunicativo de los rostros se han
interpretado en gran medida dentro del contexto de la comunicación humana cara a cara. Sobre la
base de estas conceptualizaciones existentes, el artículo defiende la necesidad de comprender cómo
se comunican los rostros más allá del marco de la comunicación humana cara a cara. En una era de
sistemas algorítmicos y automatizados que no están impulsados principalmente por mensajes abiertos
elaborados a propósito por humanos, sino por máquinas que ensamblan rastros de datos en formas
significativas, los rostros ya no son significativos (si alguna vez lo fueron) solo para los humanos. Para
comprender el papel y la importancia de los rostros dentro de la cultura de las máquinas, el
reconocimiento facial y la comunicación mediada, este artículo aboga por una conceptualización
renovada del rostro como parte de la comunicación entre humanos y máquinas.
Lo que interesa en este artículo es cómo podríamos teorizar el lugar del rostro dentro de la cultura
de la máquina algorítmica, a la luz de su historia tecnocultural. El objetivo es doble: por un lado, el
artículo busca ubicar una noción de rostros comunicativos en una historia mucho más larga de
teorización de las capacidades representativas, expresivas y relacionales de los rostros, tanto dentro
como fuera de los medios y la comunicación. Por otro lado, este artículo se pregunta cómo, dados los
antecedentes de esta historia, podríamos llegar a pensar en las capacidades comunicativas de los
rostros en aplicaciones de IA, y cómo estos nuevos usos en los sistemas biométricos actuales pueden
contribuir a reconfigurar nuestra comprensión de que es la comunicación.

El artículo está estructurado de la siguiente manera: primero, revisa cómo se han teorizado
previamente los rostros dentro de la disciplina de los medios y las comunicaciones. El propósito es
mostrar cómo a los rostros, algo que damos más o menos por sentado, se les asigna un papel
poderoso y significativo en la configuración de formas interpersonales y mediatizadas de comunicación
humana. Luego, el artículo procede a considerar específicamente la cara dentro de la visión artificial.
En la segunda parte del artículo, considero los rostros dentro de una historia tecnocultural más larga
de los sistemas de reconocimiento facial, comenzando con el papel de la fotografía y la fisonomía,
hasta los sistemas de aprendizaje automático contemporáneos. En la parte final del artículo, se
argumenta que las formas humanas y maquínicas de entender los rostros no están tan separadas
como podría parecer a primera vista. Al considerar los ensamblajes maquínicos del reconocimiento
facial en la actualidad, lo que se hace evidente es cómo las concepciones social, representacional y
afectiva del rostro y la noción matemática y computacional del rostro deben entenderse como parte
de un mismo sistema operativo. En una época en que nuestro digital
Machine Translated by Google

640 Medios, cultura y sociedad 44(4)

Las fotografías, las imágenes de perfil y las selfies ya no son meras muestras de representación en la
configuración de las relaciones interpersonales, sino que cumplen una función productiva y de desempeño en
los ciclos de retroalimentación del aprendizaje automático. Es necesario repensar cómo, por qué y para quién
se comunican los rostros. Para hacer esto, este artículo finalmente defiende la conceptualización del potencial
comunicativo de los rostros en la cultura de las máquinas en términos de lo que denomino trabajo facial
algorítmico, o más coloquialmente, comunicación facial.

Encontrar rostros en la teoría de la comunicación

Expresiones faciales

Si bien la teoría de la comunicación tradicionalmente ha privilegiado el habla y la escritura sobre otras


modalidades de comunicación, los rostros juegan un papel particularmente importante en la investigación
sobre la comunicación no verbal. En un sentido amplio, la comunicación no verbal es cualquier forma de
comunicación que utiliza otros medios además del lenguaje (Manusov y Patterson, 2006).
Los estudios sobre comunicación no verbal analizan, entre otras cosas, los potenciales comunicativos de los
movimientos corporales (cinética), el tacto (háptica) y las expresiones faciales (una forma de cinética) (Ekman
y Friesen, 1975; Mehrabian, 2017). La comunicación no verbal también engloba los potenciales comunicativos
de las cosas materiales como la ropa y los textiles (aspecto físico), o el papel comunicativo de las ausencias y
el silencio (parte de lo que se conoce como vocálicos). En términos de la cultura de la máquina, la comunicación
no verbal juega un papel importante en el campo de la interacción humano-robot (HRI). Aquí, la apariencia y
los potenciales expresivos de la cara de un robot son un área activa de estudio. Lo que suele interesar son las
capacidades del robot para "leer" rostros humanos y viceversa (Admoni y Scassellati, 2017; Song y Luximon,
2020).

En la interacción humano-humano y humano-robot, la expresión facial afectiva es una característica clave


de la comunicación no verbal. Gran parte del trabajo existente en estos campos se basa en las influyentes
teorías del psicólogo Paul Ekman y sus colegas, desarrolladas durante la década de 1970. Según estas
teorías, las emociones humanas son universales y biológicamente determinadas, siendo el rostro humano
capaz de mostrar un conjunto de pocas emociones básicas (Ekman, 1970; Ekman y Friesen, 1975). El sistema
de codificación de acción facial (FACS) de Ekman y Friesen (1978), que desarrollaron, sigue siendo un
esquema de codificación ampliamente utilizado para las expresiones faciales, sobre todo para el desarrollo de
sistemas de reconocimiento facial (Gates, 2011).
Los estudios que vinculan las expresiones faciales, los gestos, la postura y los cambios en la posición del
cuerpo con los rasgos y actitudes de la personalidad ahora se utilizan ampliamente para legitimar los procesos
de toma de decisiones automatizados en todo, desde las relaciones humanas hasta los mercados financieros
y de seguros.
La empresa de tecnología de reclutamiento HireVue, por ejemplo, ha sido objeto de un gran escrutinio
público por afirmar que usa un algoritmo de escaneo facial de IA para encontrar al mejor candidato para un
trabajo. Basado en la suposición de que las expresiones faciales revelan una verdad interna sobre una
persona, HireVue implementa un software de detección facial para clasificar a los candidatos frente a otros
solicitantes, 'basado en un puntaje de "empleabilidad" generado automáticamente' (Harwell, 2019).
Curiosamente, en una publicación de blog de la empresa, HireVue reconoce explícitamente que la taxonomía
de Ekman y Friesen es fundamental para su idea de negocio (https://www.hirevue.com/blog/
contratación/comunicación-no-verbal-en-entrevista-evaluaciones). Mientras que HireVue anunció
Machine Translated by Google

Bucher 641

a principios de 2021 que dejaría de usar el análisis visual en las nuevas evaluaciones de reclutamiento, en parte
debido a las críticas prolongadas que la tesis de la universalidad de Ekman ha enfrentado por parte de
antropólogos culturales y otros, el legado del trabajo de Ekman todavía ocupa un lugar preponderante en gran
parte del trabajo académico sobre robótica y reconocimiento facial.

Rostros mediadores

En los estudios de cine y televisión, los rostros están sobre todo dotados de valor representativo y simbólico.
Para Gunning (1997), el expresivo rostro humano “transformó el cine de un mero medio de reproducción a una
forma de arte única”. Como se ejemplifica en los estudios del primer plano cinematográfico, los potenciales
mediadores de los rostros parecen inmensos. Como señala Doane (2003), el rostro cinematográfico se puede
usar para significar todo, desde la individualidad hasta tipos sociales específicos, o se puede usar para transmitir
intersubjetividad. No todo, sin embargo, está escrito en la cara. Gran parte de lo que comunican los rostros se
encuentra entre "superficie y profundidad, exterioridad e interioridad". Siempre hay algo más allá' (Doane, 2003:
96). Así, Doane (2003) señala: 'Apenas es posible ver un primer plano de una cara sin preguntar: ¿qué está
pensando, sintiendo, sufriendo? ¿Qué está pasando más allá de lo que puedo ver?' (pág. 96).

La idea de que uno puede leer las caras como un libro, tanto literalmente como entre líneas, ha sido durante
mucho tiempo un tropo común. El estudioso de la televisión Frosh (2009) se basa en esta aparente textualidad
cuando conceptualiza los rostros como una indicación de 'los sentimientos de un personaje' y 'expresivos de las
relaciones con los propios espectadores' (p. 90). Tomando como ejemplo las "cabezas parlantes" de la televisión,
Frosh considera cómo funciona el rostro humano como una estructura comunicativa paradójica. Los presentadores
de noticias y los actores de los anuncios se dirigen directamente al espectador a través de gestos y discursos
verbales, manteniendo la ilusión de una interacción parasocial entre el rostro televisado y sus espectadores
(Frosh, 2009). Al sensibilizar a los espectadores sobre una plétora de rostros diferentes, Frosh dota a la televisión
de la capacidad de mediar entre las personas y de condicionar cómo llegamos a relacionarnos unos con otros a
una escala más global.
En este sentido, podríamos considerar las caras como una forma de interfaz o pantalla. Como escribe
Fedorova (2020), 'la interfaz es un lugar de conexión entre un ser humano y un sistema digital que les permite
comunicarse entre sí para generar e intercambiar información' (p. 3). Como punto de conexión entre humanos y
máquinas, los rostros pueden considerarse pantallas de visualización de datos. A diferencia de la interfaz gráfica
de usuario de la computadora, que actúa como un punto de intercambio mutuo de información entre humanos y
máquinas, el intercambio es más unidireccional. En el caso del reconocimiento facial, los rostros generan y
brindan información pero no reciben mucho a cambio. Esto se puede ver más fácilmente en el caso de los selfies.

Desde que 'selfie' entró en el léxico como Palabra del año en 2013 por Oxford Dictionaries, esta forma de
autorretrato digital ha atraído la atención de investigadores de una amplia gama de disciplinas. Definido como
un fenómeno digital relacionado con la 'circulación de retratos fotográficos digitales autogenerados, difundidos
principalmente a través de las redes sociales' (Senft y Baym, 2015: 1588), los selfies ejemplifican las capacidades
mediadoras de los rostros. Por un lado, los selfies constituyen un modo primario de autopresentación en los
medios digitales. Por otro lado, los selfies deben entenderse como una forma de práctica social. El papel de los
rostros humanos no se limita al hecho obvio de que la mayoría de los selfies son representaciones del rostro. La
cara selfie también es productiva.
Machine Translated by Google

642 Medios, cultura y sociedad 44(4)

En la cultura actual de las máquinas, los selfies cumplen múltiples funciones, entre ellas: entrenar
algoritmos de aprendizaje automático, depositar cheques a través de teléfonos inteligentes, permitir que
sistemas como Facebook reconozcan y etiquete automáticamente a personas en las fotos, ayudar al personal
policial a identificar a los sospechosos de delitos y evitar que los autos que conducen por sí mismos. golpeando a la gente.
Es importante destacar que para nuestra discusión sobre la cultura de las máquinas, las selfies son más que
un medio para representarse a sí mismo. Como señalan Zhao y Zappavigna (2018), 'muchas de las tecnologías
para el aumento de selfies se basan en la tecnología de reconocimiento facial que hace que el rostro sea
"legible" por las máquinas' (p. 675). Como tal, los selfies alimentan la visión artificial y funcionan cada vez más
para "normalizar la biometría y la manipulación automatizada de imágenes" (Rettberg, 2017).

Enfrentarse a uno mismo y a los demás

Todos usamos nuestros cuerpos, caras y apariencias físicas para comunicarnos, ya sea intencionalmente o
no. En el trabajo de Goffman (1959) sobre la presentación del yo en la vida cotidiana, describió cómo los
individuos y los grupos mantienen y manejan las impresiones del yo en las interacciones sociales. Para
Goffman, las interacciones sociales son intrínsecamente inciertas. Para mitigar esta incertidumbre, la gente
buscará señales sociales, gestos expresivos y marcadores de estatus como parte de un proceso continuo de
"gestión de impresiones" (Goffman, 1959). Sin embargo, no todas las impresiones se pueden controlar.
Goffman distingue entre expresiones dadas
(lo que decimos, o lo que se entiende más convencionalmente como comunicación hablada intencionada) y
expresiones emitidas (comunicación no verbal, como gestos faciales y tono de voz, que a menudo se toman
como no intencionados ya que la persona puede no ser consciente de ellos). Mantener una situación social y
permanecer en el personaje requiere mucho trabajo, no solo del individuo, sino de todo el grupo de
interlocutores, una forma de trabajo que Goffman (1955) denominó 'face-work'. Según Goffman, cada
interacción social conlleva el riesgo de que los individuos pierdan prestigio, lo que significa que su sentido de
sí mismos y su impresión en los demás pueden verse en peligro.

Sin embargo, la idea de la cara y el trabajo de la cara como vinculados a la autoimagen en las relaciones
sociales no surgió con el interaccionismo simbólico de Goffman. Como reconoce Goffman (1967) Edges en
una nota a pie de página, su conceptualización del rostro está en deuda con lo que él llama 'la concepción
china del rostro' (p. 6). En un relato antropológico clásico del rostro, Hu (1944) distingue entre dos significados
del rostro en chino: lian y mianzi.
– representando los caracteres morales y sociales de la cara respectivamente. Mientras que el segundo está
fuertemente ligado a la reputación y el reconocimiento de los demás, el primero está más ligado al sistema
ético confuciano de la virtud. Lo importante aquí no son tanto sus diferencias semánticas, sino sus suposiciones
subyacentes de relacionalidad. Zhang et al. (2019) señalan que existen algunas diferencias ontológicas
fundamentales en la noción de rostro de Goffman y la forma de pensar china. Mientras que Goffman parece
asumir un 'yo independiente dentro de las interacciones sociales', la concepción china no asume tal
independencia de la estructura social (Zhang et al., 2019: 73). Como señalan los estudiosos de la concepción
china del rostro, dentro del contexto cultural chino el rostro depende profundamente de la posición social y las
responsabilidades familiares (Ho, 1976; Qi, 2011; Zivkovic, 2020).1 En otras palabras, la concepción china del
rostro cara es un 'yo relacional que se constituye en las estructuras filiales de la vida social china' donde 'la
personalidad depende del estatus y las acciones de otros con quienes uno está socialmente conectado,
particularmente la familia' (Zivkovic,
Machine Translated by Google

Bucher 643

2020). Esto significa que un individuo puede quedar mal como resultado de las acciones de otros (por
ejemplo, un miembro de la familia), y viceversa.
Es importante destacar que estas concepciones de la cara no deben entenderse demasiado literalmente.
No es el mismo tipo de cara que se estudió en los estudios lingüísticos y psicológicos sobre la comunicación
no verbal discutidos anteriormente. Más bien, estos rostros sociológicos son inherentemente sociales y
simbólicos. Como dice Goffman (1967):

el rostro de la persona es claramente algo que no está alojado en o sobre su cuerpo, sino algo que se
ubica difusamente en el fluir de los acontecimientos en el encuentro y se manifiesta sólo cuando estos
acontecimientos son leídos e interpretados por las valoraciones expresadas en ellos. (pág. 7)

Para Goffman (1955), el rostro tiene que ver explícitamente con la autoimagen y el "valor social que una
persona efectivamente reclama para sí mismo por la línea que otros suponen que ha tomado durante un
contacto particular" (p. 213), mientras que la concepción china pone en primer plano el aspecto relacional y
en red de la cara.
Este énfasis en el rostro como un encuentro con otros y una entidad relacional también recuerda la
noción de facialidad de Deleuze y Guattari (2004). Para Deleuze y Guattari (2004), cada rostro es engendrado
por una 'máquina abstracta de facialidad' (p. 187), un sistema significante inmanente que es cultural e
históricamente específico. Esto significa que hay rostros concretos, así como formas culturalmente
específicas en las que estos rostros operan y están hechos para significar. Como escriben Deleuze y Guattari
(2004), 'no es la individualidad del rostro lo que cuenta sino la eficacia del cifrado que hace posible, y en qué
casos lo hace posible' (p. 194).

La facialidad puede entenderse como una especie de poder significante que emana de rostros
particulares, por ejemplo, el poder del rostro de los líderes políticos, o el poder que el rostro de la celebridad
presta al cine. Nuevamente podemos ver el elemento cinematográfico de los rostros, entendidos como
lugares donde se moviliza la identidad y la comunicación. Como explican Chesher y Andreallo (2021),
'[f]aciality es una "máquina abstracta" que entra en juego cada vez que alguien o algo se encuentra con algo
que funciona como una cara, creando significado e identidad, emoción y subjetividad, superficie y
profundidad. , significación y subjetivación» (pág. 85). El rostro no es una unidad, a pesar de lo que podría
sugerir el uso de la forma singular, sino más bien un logro distribuido. En la siguiente sección, nos alejaremos
de las máquinas abstractas de la facialidad y las formas en que se han teorizado los rostros en la
investigación de los medios y la comunicación en su interpretación amplia, hacia tecnologías más concretas
técnicas e históricas de agregación y reconocimiento de rostros.

Frente a la IA en el reconocimiento facial automatizado


Las redes sociales de hoy están repletas de rostros. Facebook se construye literalmente en torno a un
directorio social de rostros. Las plataformas orientadas a lo visual como Instagram o TikTok están llenas de
selfies. Tinder alienta a sus usuarios a elegir posibles intereses amorosos basándose en un escaneo
superficial del rostro de un extraño. Snapchat ofrece filtros faciales llamados 'lentes'.
Abundan las aplicaciones de embellecimiento. Todas estas aplicaciones incorporan algún tipo de tecnología
de reconocimiento facial. Nuestros dispositivos digitales funcionan como detectores de rostros. Los teléfonos
inteligentes, como los teléfonos Galaxy premium de Samsung, ofrecen reconocimiento facial y huella digital
Machine Translated by Google

644 Medios, cultura y sociedad 44(4)

sensor para desbloquear el teléfono. Face ID de Apple es una tecnología de mapeo biométrico que
supuestamente convierte la cara de un usuario en un dispositivo de autenticación seguro, que se
puede usar para asegurar iPhones y autorizar pagos a través de Apple Pay.
Si bien la tecnología de reconocimiento facial a menudo se vincula con el ámbito del control
estatal, la tecnología de consumo contemporánea muestra cuánto se ha convertido en una parte
integral de nuestra vida cotidiana. Es precisamente en el 'gadget de consumo 'benigno' y
lúdico' (Ellerbrok, 2011: 530) donde el poder y el valor de los rostros comunicativos se pueden
encontrar hoy con mayor facilidad. Los rostros digitales y las tecnologías utilizadas para capturarlos,
almacenarlos y procesarlos 'desempeñan un papel en la alteración de las condiciones de visibilidad
personal, intimidad pública y relaciones' (McCosker y Wilken, 2020: 37). Esto quiere decir que las
caras sí. Representan, identifican, aseguran, revelan, sugieren, incitan, moldean, desbloquean,
realizan, comunican. Para comprender cómo se comunican exactamente los rostros dentro de la
cultura de las máquinas, debemos considerar su lugar en una historia más larga de prácticas
representacionales y el papel que desempeñan las tecnologías "en relación con esa historia" (Gates, 2011: 193).

Legados históricos
En muchos sentidos, la historia de las tecnologías de agregación de rostros comienza en el siglo XIX
con el vínculo de la invención de la fotografía y el racismo científico de la fisonomía. Una herramienta
de clasificación científica popular para muchos de los científicos más destacados de la época, la
fisonomía "sostenía que los rostros de las personas mostraban los signos de sus cualidades esenciales
y podían analizarse visualmente como un medio para medir el valor moral" (Gates, 2011: 19) .2 Al
vincular el estudio de los rasgos faciales con los rasgos innatos de la personalidad y el valor humano,
la fisonomía se convirtió en una herramienta útil para identificar, registrar y controlar a las personas en
nombre del racismo científico (Edkins, 2015). La fotografía desempeñó un papel clave para posibilitar
estas nuevas prácticas pseudocientíficas. Con el advenimiento de la fotografía, los rostros pudieron
concretarse y hacerse discretos. Podrían catalogarse, agregarse, superponerse y compararse. Muchos
de los científicos de la época desarrollaron sus propias técnicas fotográficas para documentar los
rasgos faciales de las personas y las anomalías percibidas. El eugenista Francis Galton, por ejemplo,
desarrolló una técnica que denominó «fotografías compuestas». Al superponer fotografías, Galton
afirmó haber revelado patrones de tipos genéricos de personas; 'pobres, imbéciles, criminales,
desviados' (Edkins, 2015: 103).
La fotografía también se convirtió en un instrumento en la creación de lo que a veces se denomina
el primer sistema de identificación biométrica. Inventada por el oficial de policía de París Alphonse
Bertillon, uno de los contemporáneos de Galton, la técnica Bertillonage consistía en una combinación
de medidas antropométricas y un nuevo estándar para la fotografía forense, más conocida hoy como
foto policial. El método Bertillonage fue ampliamente adoptado por la policía y el sistema judicial como
'un sistema bipartito, que coloca un registro individual 'microscópico' dentro de un agregado
'macroscópico'' (Sekula, 1986: 18). Esto significaba que el acto de identificación no solo dependía del
sospechoso criminal individual, sino, lo que es más importante, de las referencias cruzadas y la
comparación con el conjunto archivado de posibles sospechosos. Aunque la técnica de Bertillonage
finalmente fue reemplazada por la adopción de huellas dactilares como el sistema dominante de
identificación forense, el principio de traducir el rostro en datos numéricos con el fin de identificación y
reconocimiento de patrones sigue siendo una lógica subyacente de cómo funcionan los sistemas de
reconocimiento facial para este día.
Machine Translated by Google

Bucher 645

El desarrollo del reconocimiento facial automatizado, entonces, se basa profundamente en una especie de
esencialismo biológico que funcionó para dividir y clasificar arbitrariamente a las poblaciones humanas en función
de sus rasgos faciales (Stark, 2019). Como nos recuerda Simone Browne, los sistemas biométricos han servido
como medio para clasificar visualmente a las personas, particularmente en términos de imponer una categoría de
raza. Para Browne (2010), estos sistemas promulgan un proceso de 'epidermalización digital' que permite que los
cuerpos se codifiquen como datos y sirvan como evidencia y control. Este proceso de codificación está lejos de
ser neutral o equitativo en la medida en que algunas caras se comunican con la máquina de manera más clara o
con más fuerza, para bien o para mal.
Como atestiguan los numerosos casos de identificaciones/identificaciones erróneas de género y raza en los
sistemas de reconocimiento facial, algunas caras se omiten constantemente o se hacen más o menos visibles en
comparación con otras (Buolamwini y Gebru, 2018). Para Stark (2019), esto hace que los sistemas de
reconocimiento facial sean socialmente tóxicos, ya que "se basan en encontrar razones numéricas para interpretar
a algunos grupos como subordinados" (p. 53). De manera similar al argumento de Rettberg (2017) sobre las
selfies que sensibilizan a las personas sobre el control biométrico, el trabajo de Stark (2019) apunta a los efectos
peligrosos, a menudo racistas y discriminatorios, de los lentes de Snapchat aparentemente lindos y los emojis de
los teléfonos inteligentes.

Bases tecnológicas
Los sistemas automatizados de reconocimiento facial funcionan aproximadamente con los mismos parámetros.
El primer paso es detectar un rostro en una imagen. Esto sucede a menudo superponiendo la cara con cuadrículas,
dibujando cuadros a su alrededor o distinguiendo una cara de su fondo y elementos vecinos. Luego, las
características deben extraerse y clasificarse para crear una representación matemática de la cara. Estas
características permiten que la máquina las relacione con las imágenes correspondientes en la base de datos o
plantilla de cara. Solo el último paso del proceso implica el reconocimiento del rostro, generalmente con fines de
identificación o verificación. En esencia, este tipo de sistemas biométricos 'ven' el rostro 'como una configuración
particular de medidas superficiales para ser procesadas analítica y estadísticamente' (Pinchevski, 2016: 195).

Los primeros intentos de automatizar el reconocimiento facial usando computadoras comenzaron en la década
de 1960 por uno de los primeros pioneros de la investigación de inteligencia artificial, Woodrow Wilson Bledsoe.
De acuerdo con gran parte de la computación temprana, esta investigación fue financiada en gran parte por los
servicios de inteligencia de EE. UU. (Lee-Morrison, 2019). Si bien el objetivo era enseñar a una computadora a
reconocer 10 caras, en su primer año de investigación, el equipo solo logró reconocer una cara (Raviv, 2020). A
medida que avanzaba la investigación de Bledsoe, finalmente se decidió por un sistema digitalizado inspirado en
el sistema de Bertillon discutido anteriormente, basado en gran medida en un conjunto de datos que contenía
todos los rostros de hombres blancos de varias edades (Lee-Morrison, 2019). Técnicamente, los primeros intentos
de Bledsoe fueron modestos para los estándares actuales y dependían por completo de que un operador humano
ingresara los datos en el sistema. El primer intento exitoso de automatizar por completo el proceso de
reconocimiento facial fue realizado en 1973 por el científico informático japonés Takeo Kanade. Basándose en un
conjunto de datos de 850 fotografías digitalizadas, un bien escaso en ese momento, Kanade desarrolló un sistema
de coincidencia de rostros basado en el reconocimiento de características, sin necesidad de intervención humana
(Raviv, 2020). Sin embargo, no fue hasta principios de la década de 1990 que se desarrollaron nuevos métodos
que no se basaban en retratos fotográficos, sino que también podían reconocer rostros en imágenes que
contenían otros objetos.
Machine Translated by Google

646 Medios, cultura y sociedad 44(4)

La ruptura con las concepciones anteriores del reconocimiento facial se produjo con un artículo de Turk y
Pentland (1991), que describía el método de caras propias basado en el análisis de componentes principales (PCA).
En lugar de modelar el reconocimiento facial en rasgos faciales individuales y las relaciones entre ellos, como se
había hecho en investigaciones anteriores, el método de caras propias se propuso leer el rostro de manera holística.
Es decir, las caras propias se pueden describir como abstracciones de caras desglosadas en los componentes
principales de las caras. El objetivo con este enfoque era crear una cantidad mínima de caras propias que pudieran
representar adecuadamente todo el conjunto de entrenamiento y, por lo tanto, reducir la cantidad de datos que
debían procesarse para detectar una cara. Además, como explica Lee-Morrison (2019), lo que diferenció el enfoque
algorítmico del rostro propio de los enfoques anteriores fue que produjo una imagen como parte de su proceso
algorítmico, lo que permitió por primera vez una visión del rostro producida por una máquina, un una especie de
versión moderna de las fotografías compuestas de Galton.

Si bien gran parte del reconocimiento facial actual se basa en el aprendizaje profundo y las redes neuronales,
el proceso de encontrar rostros en muchos casos aún se basa en un enfoque para la visión por computadora
basada en datos desarrollado por Paul Viola y Michael Jones en 1991. Como dice Leslie (2020). , el algoritmo de
Viola-Jones fue 'un referente en el cambio de las técnicas de visión por computadora de métodos tradicionales,
basados en el conocimiento y basados en reglas a enfoques de aprendizaje automático basados en datos' (p. 10).
Viola y Jones esencialmente fueron pioneros en la detección de rostros al proponer un clasificador que pudiera
distinguir fragmentos de imágenes e identificar si una imagen contiene un rostro o no.

En términos de reconocimiento de imágenes, lo que más se usa hoy en día son las redes neutrales
convolucionales (CNN) que funcionan al dividir las imágenes en grupos más pequeños de píxeles llamados filtros.3
Cada filtro es una matriz de píxeles, en la que la red luego realiza una serie de cálculos, comparándolos con píxeles
en sus campos vecinos, de acuerdo con un patrón específico que la red está buscando. La CNN, como cualquier
red neuronal, funciona a través de capas y niveles de cómputo. La CNN sabe qué buscar a través de grandes
cantidades de datos de entrenamiento y etiquetado. En el caso de Facebook, por ejemplo, los datos de
entrenamiento y el etiquetado de esas imágenes son realizados en gran parte por los propios usuarios. Como
escribe Paglen (2016), cuando pones una imagen en Facebook, estás alimentando su algoritmo DeepFace con
información sobre "cómo identificar a las personas y cómo reconocer lugares y objetos, hábitos y preferencias,
identificaciones de raza, clase y género". , estados económicos, y mucho más'. Según los informes, esta red
neuronal "logra más del 97 por ciento de precisión en la identificación de individuos, un porcentaje comparable al
que puede lograr un ser humano" (ibíd.). Esta tasa de precisión solo se logra a través de un proceso de comparación
repetida, ligeramente más correcto para cada convolución. Si bien una CNN funciona bien con imágenes fijas, para
imágenes en movimiento, el proceso debe complementarse con una red neuronal recurrente (RNN) para trabajar
con modelos sensibles temporalmente.

Lo que es fundamental para el funcionamiento de los modelos de aprendizaje profundo utilizados para el
reconocimiento facial son grandes conjuntos de datos de caras correctamente etiquetadas, que se muestran desde
diferentes ángulos, formas e iluminación. Uno de los primeros y más grandes conjuntos de datos de imágenes es
ImageNet. Con la ayuda de los trabajadores de Amazon Mechanical Turk, hasta la fecha se han anotado a mano
más de 14 millones de imágenes. Si bien ImageNet no se limita a las caras, ahora hay muchas bases de datos de
imágenes dedicadas solo a las caras. Si el aprendizaje profundo depende de grandes cantidades de imágenes
etiquetadas con precisión, el trabajo de Crawford y Paglen (2019) sobre la política de datos de entrenamiento es un recordatorio.
Machine Translated by Google

Bucher 647

que este ideal no siempre es palpable. Por ejemplo, al estudiar las clasificaciones de imágenes de
ImageNet, encontraron que el actor Sigourney Weaver está etiquetado como 'hermafrodita', o que una
'mujer joven tendida en una toalla de playa es una 'cleptómana'' (Crawford y Paglen, 2019). Como ha
demostrado mucha investigación sobre equidad, responsabilidad y transparencia en el aprendizaje
automático, cuando los algoritmos discriminan, a menudo es a expensas de los ya marginados, las
personas de color, las mujeres, las comunidades LGBTQ+, las personas con discapacidades y la clase
trabajadora (Denton et al. ., 2020). Tales fallas, Denton et al. (2020), a menudo se deben a la
'subrepresentación de estos grupos en los datos sobre los que se construyen estos sistemas o
correlaciones indeseables entre ciertos grupos y etiquetas objetivo en un conjunto de datos' (p. 1).

Lo que estas discusiones resaltan sobre todo es la discrepancia entre lo que ve la máquina y cómo
se le enseña y se le hace ver de maneras particulares. Entre las formas rectangulares del método de
caras propias, las circunvoluciones de una red neuronal y la política de conjuntos de datos históricamente
sesgados e injustos, ¿dónde ubicamos la cara comunicativa y su significado en la cultura actual de las
máquinas? ¿Los rostros transmiten información o proporcionan una representación simbólica? ¿Los
rostros se comunican en virtud de predisposiciones psicológicas o como parte de una comprensión
intersubjetiva? Así como no existe una teoría unificada de la comunicación de la que hablar, no podemos
esperar que las capacidades comunicativas de los rostros sigan una sola línea de concepción. En
cambio, como muestra la sección final, cómo y cuándo se comunican los rostros en la cultura de las
máquinas debe entenderse como parte de un proceso más complejo y continuo de lo que llamo trabajo
facial algorítmico o simplemente comunicación facial.

Hacia una comprensión de la comunicación fAIce


Los sistemas de reconocimiento facial complican nuestra comprensión de las formas de comunicación
existentes, que se han conceptualizado principalmente en términos de procesos humanos. Si bien el
rostro humano sigue siendo una de las principales modalidades de comunicación en la comunicación
humana, el rostro humano claramente también se comunica con la máquina. Cuando los humanos le
hablan a la máquina, ya sea intencionalmente o no, están 'hablando al sistema' al compartir sus huellas
digitales y metadatos (Jensen y Helles, 2017). Sin embargo, como señalan Guzmán y Lewis (2020), "la
IA y las interacciones de las personas con ella no encajan perfectamente en los paradigmas de la teoría
de la comunicación" (p. 71). Para teorizar mejor la comunicación con máquinas en el ámbito digital,
Guzmán y otros han estado abogando por un área emergente de investigación en comunicación centrada
en la "creación de significado entre humanos y máquinas" (Guzmán, 2018: 1). Si bien gran parte de la
investigación emergente en el área de la comunicación hombre-máquina (HMC) parece estar enfocada
en el medio de la voz y la máquina como comunicador en el sentido de que los bots de chat y los
asistentes basados en voz como Alexa de Amazon están respondiendo para los humanos, los rostros
quedan algo fuera de estas discusiones. Aquí quiero sugerir que el rostro constituye uno de los principales
sitios para el estudio de la creación de significado entre humanos y máquinas. Lo que muestra el papel
de las caras en las aplicaciones actuales de IA es que las caras se comunican no solo con la máquina
sino también en conjunto con la máquina.

Para comprender mejor las capacidades comunicativas de los rostros en la cultura de las máquinas,
sugiero el neologismo 'comunicación facial' como una forma potencialmente fructífera de conceptualizar
Machine Translated by Google

648 Medios, cultura y sociedad 44(4)

las formas de comunicación características de las interacciones a menudo involuntarias de las personas
con las tecnologías de reconocimiento facial, pero también las relaciones de poder inherentes que están
en juego en estas interacciones. Si HMC ofrece un nuevo marco generativo para teorizar la máquina como
sujeto comunicativo, espero que la noción de comunicación facial traiga a primer plano una forma posible
de conceptualizar la facialidad en juego en los sistemas de reconocimiento facial. El rostro, sugieren
Deleuze y Guattari (2004), no es un hecho sino un ensamblaje social y se define por sus relaciones y
apego a otras personas, escenarios históricos y situaciones sociales. Como tal, la comunicación facial
puede entenderse como una forma de trabajo facial algorítmico en la medida en que indica el tipo de
trabajo y el intercambio comunicativo en juego cuando los rostros humanos y las máquinas se encuentran.
Dada la descripción general anterior de cómo el significado de los rostros está formado por sus legados
históricos, encuentros sociales e inscripciones en aparatos técnicos, la pregunta es cómo esos vínculos
se unen para formar una noción de comunicación facial. Si los rostros se comunican de manera diferente
con los humanos y las máquinas, ¿dónde nos encontramos con respecto a las capacidades comunicativas
de los rostros en las aplicaciones de IA?

Rostros reveladores

Tanto para los humanos como para las máquinas, el rostro funciona como puerta de entrada a un aspecto
más o menos oculto del ser humano. Es en este sentido básico que los rostros comunican o median. Sin
embargo, para los enfoques sociales y estéticos de los rostros, esta capacidad mediadora permanece en
el nivel de la metáfora. Sin embargo, para la investigación en comunicación no verbal y visión artificial, las
medidas y expresiones faciales se tratan más literalmente como puertas de entrada fácticas hacia el
verdadero yo aparente de una persona. Esto se vuelve más evidente cuando se observan algunas de las
aplicaciones actuales de IA que utilizan reconocimiento facial. Tomemos como ejemplo a la empresa
emergente israelí Faception, que utiliza el aprendizaje automático para "puntuar imágenes faciales
utilizando tipos de personalidad como "investigador académico", "promotor de marca", "terrorista" y "pedófilo" (Chinoy, 20
Según el sitio web de la empresa, un 'terrorista' se caracteriza por ser alguien que 'sufre un alto nivel de
ansiedad y depresión'. Introvertido, carente de emoción, calculador, tiende al pesimismo, con baja
autoestima, baja autoimagen y cambios de humor' (Faception, 2021). Faception afirma ser capaz de
determinar si alguien es un terrorista con un 80% de precisión, basándose en medir las distancias de
diferentes puntos en la cara. Al igual que Faception y el mencionado HireVue, una empresa con sede en
Tokio lanzó recientemente una aplicación a los inversores llamada DeepScore, que supuestamente es
capaz de detectar la confiabilidad de alguien en función de una lectura de la cara por parte de la IA
(Feathers, 2021). Como es el caso con muchas afirmaciones similares sobre su poder epistémico, las
caras a menudo se toman al pie de la letra. En estas aplicaciones, los rostros se tratan como una puerta
de entrada a un yo supuestamente verdadero, sin necesidad de mayor explicación o contextualización.
Pero, ¿las caras realmente hablan por sí mismas?

Sin embargo, tales suposiciones fisionómicas no son solo una cuestión de nuevas empresas
periféricas, sino parte de cómo se imagina e implementa el reconocimiento facial de manera más amplia.
El caso de Cambridge Analytica mostró cómo los rostros están siendo fuertemente politizados y
valorizados. Basándose en la investigación de científicos del comportamiento como Michal Kosinski
(Kosinski et al., 2013), quien desarrolló una versión anterior de una aplicación de personalidad integrada
en Facebook, Cambridge Analytica afirmó ser capaz de revelar las orientaciones políticas y otros atributos
de una persona. , simplemente analizando sus imágenes faciales obtenidas de Facebook
Machine Translated by Google

Bucher 649

y otros sitios. Más recientemente, el trabajo de Kosinski sobre IA y persuasión masiva ha ganado mucha
atención por afirmar que puede predecir la orientación sexual de una persona en función de sus
expresiones faciales.
En este estudio, Kosinski y Wang entrenaron un software de reconocimiento facial para distinguir
entre personas homosexuales y heterosexuales. Al descargar más de 300 000 imágenes de perfil de
sitios de citas y entrenar una muestra de más de 35 000 imágenes faciales de personas autoidentificadas
como homosexuales y heterosexuales, Wang y Kosinski afirmaron que el algoritmo podía distinguir
correctamente entre personas homosexuales y heterosexuales el 91 % de las veces para hombres y
mujeres. 83% del tiempo para mujeres (Wang y Kosinski, 2018). Curiosamente, los autores reconocen
en un apéndice del artículo que su trabajo 'presenta serios riesgos para la privacidad de las personas
LGBTQ' y que debatieron si publicar o no los resultados. Sin embargo, razonaron que "la seguridad de
las personas homosexuales y otras minorías no depende de su derecho a la privacidad (que puede ser
invadido maliciosamente), sino de la protección de sus derechos humanos", y decidieron seguir adelante
con la publicación.
Ya sea que los clasificadores de reconocimiento facial puedan o no calificar con precisión la
orientación sexual o política de alguien, lo que estos ejemplos muestran es cómo la tecnología y el
significado del rostro se pueden utilizar estratégicamente para fines distintos a los originalmente previstos.
Muy en la línea de la misión de Galton de encontrar tipos de personas estadísticamente sobresalientes
que podrían usarse para gobernar poblaciones, el tipo de esencialismo biológico en juego en el diseño,
implementación y aplicación de tecnologías de reconocimiento facial puede tener serias consecuencias.

caras relacionales

Cómo y qué se comunican los rostros depende en parte de la audiencia. Cuando los humanos leen
rostros, buscan principalmente señales sociales. Los rostros se convierten en marcadores de identidad,
sentimientos y relaciones. Para la máquina, si se entiende en el sentido computacional, los rostros son
esencialmente un territorio para ser mapeado y medido. Si bien depende de las técnicas algorítmicas
específicas que se utilicen en cada caso, el reconocimiento facial automatizado funciona por abstracción
y comparación constante. En las tecnologías de reconocimiento facial automatizado, los rostros no se
decodifican simplemente como están, sino que se preparan cuidadosamente para ser leídos e
identificados a través de una serie de pasos. Como observa Celis Bueno (2020), esto significa que el
reconocimiento facial algorítmico no se trata simplemente de vincular un rostro a un individuo privado,
sino de usarlo como 'una fuente de información prepersonal y suprapersonal' (p. 84). El rostro no solo
'pertenece a un individuo privado, sino que constituye un banco de datos de plantillas de rostros y
conjuntos de entrenamiento' (p. 84).
Podríamos ver esta lógica más vívidamente en juego en ejemplos de reconocimiento facial erróneo.
En un caso en el que los servicios de pasaportes británicos rechazaron la solicitud de pasaporte de una
mujer negra porque supuestamente tenía la boca abierta, cuando en realidad estaba cerrada, el sistema
no la reconoció erróneamente como individuo, sino que proporcionó un resultado basado en su conjunto
de entrenamiento y diseño de sistemas. Si bien la imagen puede representarla, lo que cuenta es cómo
se lee y comprende esa imagen en relación con las imágenes archivadas de otros. Hay algunas
conexiones interesantes entre el modelado estadístico algorítmico de rostros y la concepción china de
la relacionalidad facial discutida anteriormente. Tanto en el aprendizaje automático como en las nociones
chinas de mianzi y lian, los rostros dependen del estado y las acciones de
Machine Translated by Google

650 Medios, cultura y sociedad 44(4)

otros. Mientras que el concepto chino enmarca los rostros específicamente en relación con las estructuras
sociales y las relaciones familiares, el aprendizaje automático compara los rostros con otros desconocidos.
En ambas concepciones, sin embargo, los rostros tienen menos que ver con el individuo y más con sus
relaciones y su posición como parte de las estructuras sociales. Esto significa que alguien puede perder la cara
no como resultado de sus propias acciones sino por las acciones de los demás. Si, para Goffman, cada situación
social conlleva el riesgo de quedar mal, este parece ser aún más el caso de los espacios digitales
algorítmicamente configurados. Con la cantidad de imágenes faciales que flotan en las redes sociales, los rostros
no solo corren el riesgo de verse en peligro; están en peligro.

caras perdidas
Como hemos visto, el trabajo que implica determinar la configuración del sistema también afectará la forma en
que se pueden ver las caras. Tome el etiquetado y anotación de imágenes. Como Crawford y Paglen (2019)
señalan con respecto al conjunto de datos Diversity in Faces de IBM, que contiene anotaciones subjetivas para
la edad y el género, "el género y la edad de las personas se "predicen" en función de las conjeturas de tres
trabajadores de clics sobre lo que se muestra en una fotografía extraído de Internet'. No importa cuán complejo
sea el modelo de aprendizaje profundo, cuando la precisión de los datos depende en parte de cómo los etiquetan
y anotan los trabajadores de clics mal pagados, lo que las caras comunican a la máquina también es una
cuestión de cómo han sido manejadas por humanos. intermediarios en el proceso. Ni la edad, el género ni la
raza son categorías estables. Estas categorías están culturalmente cargadas y son discutibles, y cuando se
codifican en formas binarias simples, ayudan a "imponer las normas culturales de los grupos cisgénero
predominantes de piel pálida" (Leslie, 2020: 18).

No todos los rostros están dotados de la misma capacidad para comunicarse con y hacia la máquina. Rostros
envejecidos, rostros de piel oscura, rostros gemelos y rostros en movimiento plantean distintos desafíos para las
máquinas que los interpretan. Como mostró la discusión sobre el etiquetado y la anotación, las caras no se
comunican automáticamente, sino que es necesario hacer que se comuniquen de ciertas maneras. Esto significa
que las capacidades comunicativas de los rostros en la cultura de las máquinas dependen de varios factores
diferentes, incluida su existencia previa en la base de datos, los conjuntos de entrenamiento, las mentes y la
conciencia de los diseñadores que fabrican y mantienen los sistemas, sus tratamientos diferenciales en la
aplicación y uso de esas aplicaciones por parte de instituciones y organizaciones concretas, etc. Por lo tanto, no
todas las caras existen en igualdad de condiciones. A veces, los rostros deben recopilarse a propósito, o incluso
sus propietarios deben pagar para comunicarse con la máquina, como en el caso de los empleados de Google
que se enfocan en personas sin hogar de piel oscura para obtener imágenes de sus rostros. Según se informa,
los empleados de Google estaban "golpeando el pavimento en una variedad de ciudades de EE. UU., buscando
personas dispuestas a vender sus datos faciales por un certificado de regalo de $ 5 para ayudar a mejorar los
sistemas de desbloqueo facial de Pixel 4" (Hollister, 2019).

Como se discutió, los sistemas de reconocimiento facial todavía luchan con la variedad y diversidad de
rostros. En la búsqueda de los mejores conjuntos de datos, los más completos y diversos, las empresas se
esfuerzan por encontrar y almacenar caras para refinar sus sistemas y maximizar su valor. Si los tonos de piel
más oscuros siguen siendo un desafío particular para estos sistemas, también lo hace la edad, como hemos
visto. En 2019, un desafío de Facebook llamado simplemente 'desafío de 10 años' se volvió viral porque incitaba
a las personas a publicar una foto de ellos mismos de hace 10 años y una
Machine Translated by Google

Bucher 651

a partir de hoy. Esto llevó rápidamente a la gente a especular sobre las verdaderas motivaciones
de Facebook para promover este desafío, lo que sugiere cómo sin duda beneficiaría a los sistemas
de reconocimiento facial de la empresa. Incluso si Facebook afirmó no estar directamente
involucrado en la creación de este desafío en particular, no se puede negar el valor de tales desafíos
u otros modos gamificados de jugar con caras. Es posible que falten caras en el sistema, pero
siempre se pueden agregar o reemplazar estratégicamente, con o sin la ayuda de sus legítimos
dueños

Observaciones finales
La naturaleza ubicua de los rostros, tanto en línea como fuera de línea, exige una atención renovada
a sus capacidades comunicativas, como se ha venido argumentando en este artículo. El desafío
clave para los estudiosos de la comunicación es examinar cómo el significado de la cara está
configurado por la cultura de la máquina actual y cómo la configura de manera que no recurra a una
división ontológica entre humanos y máquinas como categorías binarias. Si diferentes disciplinas,
desde la psicología hasta la sociología, los estudios de medios y la informática, ofrecen formas
distintas de teorizar la ontología y la epistemología de los rostros, sus conocimientos combinados
pueden servir como campo de pruebas para lo que he llamado comunicación facial.
Como enfatizan Deleuze y Guattari (2004) con su concepto de facialidad, lo que está en juego
es el tipo de poder significante que emana de rostros particulares. Más importante aún, como
discutimos con respecto al aprendizaje automático y las caras relacionales, hoy en día podría
incluso haber más poder significativo emanando de la acumulación y ensamblaje de caras que de
la cara individual. El concepto de comunicación fAIce no implica necesariamente que una persona
se comunique con la máquina, en el sentido que a menudo transmite la investigación en HMC
(aunque esto ciertamente puede ser un aspecto). Lo que sugiere el neologismo 'fAIce' es
precisamente las formas en que los rostros y la IA se enredan. La facilidad de las tecnologías de
reconocimiento facial difiere del poder del rostro de un líder político o una celebridad en los primeros
planos cinematográficos. Los rostros no se dan, nos recuerda Edkins (2015), sino que "existen en
un contexto cultural, geográfico e histórico particular" (p. 3). El contexto de la cultura de las máquinas
y las tecnologías de reconocimiento facial, impulsadas por redes neuronales convolucionales,
sugiere un rostro altamente performativo. Así, la cara protege a los individuos y los delata; fAIce es
a la vez lúdico y arriesgado; y fAIce genera tanto ganancias como problemas para las grandes
corporaciones.
Sin embargo, como hemos visto, esta performatividad o hacer del rostro no es algo que
necesariamente resida en el rostro mismo, sino algo que es fabricado y desencadenado por los
sistemas diseñados para absorberlo y monetizarlo. Primero, las personas tenían que acostumbrarse
a tomar selfies, participar en desafíos aparentemente divertidos en las redes sociales y aceptar
compartir fotos de ellos mismos. El análisis predictivo depende de grandes conjuntos de datos de
caras diversas y correctamente etiquetadas y anotadas. A diferencia de la textualidad de los rostros
en los estudios cinematográficos, los rostros digitales no requieren que uno lea entre líneas. La
lectura ocurre automáticamente y como parte de una red de energía distribuida. Similar a la noción
de Goffman del trabajo facial como un logro relacional para mantener una situación social, podríamos
pensar en la performatividad de la comunicación facial como una forma de trabajo facial algorítmico
destinado a mantener la máquina. Como dijo Goffman (1967) hace medio siglo, "la cara de la
persona es claramente algo que no está alojado en o sobre su cuerpo, sino algo que está
Machine Translated by Google

652 Medios, cultura y sociedad 44(4)

difusamente ubicado en el flujo de eventos en el encuentro' (p. 7). En una era en la que los rostros
son absorbidos y procesados por máquinas y las máquinas están cada vez más diseñadas para
orientarse hacia imágenes faciales, es importante preguntarse cómo y dónde se alojan los rostros,
si no en la cabeza de la persona, entonces en qué flujo de eventos, y en beneficio de quién.

Fondos
El autor no recibió apoyo financiero para la investigación, autoría y/o publicación de este artículo.

identificación ORCID

Taina Bucher https://orcid.org/0000-0002-7470-775X

notas
1. Cuando me refiero a la concepción china del rostro simplemente adopto los términos utilizados en la
literatura sociológica y antropológica al respecto. Al evitar el uso de un lenguaje que pueda parecer
universalizador, también reconozco que esta parece ser la forma común de hablar sobre esta forma
particular de enmarcar el rostro, también entre los estudiosos chinos.
2. Ver Gates (2011), Gunning (1997), Edkins (2015) y Sekula (1986) para una historización más elaborada
de la fisonomía en las artes visuales y la fotografía. Esta historia incluye el retrato y el arte de Charles
Le Brun, el pintor oficial de Luis XIV, quien creó un manual para la representación visual de la
expresión humana; el filósofo Descartes, cuya obra Las pasiones del alma (1649) se inspira en él; y el
poeta y escritor suizo Johann Kaspar Lavater, quizás más conocido por sus tratados sobre fisonomía
escritos entre 1775 y 1778.

3. La descripción de las CNN se basa en cómo las explica un representante de Google en el


siguiente video: https://www.youtube.com/watch?v=OcycT1Jwsns

Referencias
Admoni H y Scassellati B (2017) Mirada social en la interacción humano-robot: una revisión. Revista de
interacción humano-robot 6 (1): 25–63.
Browne S (2010) Epidermalización digital: raza, identidad y biometría. Sociología Crítica
36(1): 131–150.
Buolamwini J y Gebru T (2018) Sombras de género: disparidades de precisión interseccional en la
clasificación de género comercial. En: Friedler SA y Wilson C (eds) Conferencia sobre Equidad,
Responsabilidad y Transparencia. Nueva York, NY: PMLR, págs. 77–91.
Celis Bueno C (2020) El rostro revisitado: Usando Deleuze y Guattari para explorar la política del
reconocimiento facial algorítmico. Teoría Cultura y Sociedad 37 (1): 73–91.
Chesher C y Andreallo F (2021) Facialidad robótica: la filosofía, la ciencia y el arte del robot
caras. Revista internacional de robótica social 13 (1): 83–96.
Chinoy S (2019) La historia racista detrás del reconocimiento facial. New York Times. Disponible en: https://
www.nytimes.com/2019/07/10/opinion/facial-recognition-race.html (consultado el 1 de agosto de 2021)
Crawford K y Paglen T (2019) Excavando la IA: la política de las imágenes en los conjuntos de entrenamiento de
aprendizaje automático. IA de excavación. Disponible en: https://excavating.ai (consultado el 1 de agosto de 2021)
Deleuze G y Guattari F (2004) Mil mesetas: capitalismo y esquizofrenia. Londres:
Routledge.
Machine Translated by Google

Bucher 653

Denton E, Hanna A, Amironesei R, et al. (2020) Regresar a la gente: disputar conjuntos de datos de aprendizaje
automático de referencia. preimpresión de arXiv arXiv:2007.07399.
Doane MA (2003) El primer plano: Escala y detalle en el cine. Diferencias: una revista de feministas
Estudios culturales 14 (3): 89–111.
Edkins J (2015) Política de rostros. Londres: Routledge.
Ekman P (1970) Expresiones faciales universales de las emociones. Investigación de salud mental de California
Compendio 8 (4): 151–158.
Ekman P y Friesen VW (1975) Desenmascarando el rostro. Englewood Cliffs, Nueva Jersey: Spectrum-Prentice
Sala.
Ekman P y Friesen VW (1978) Manual para el Sistema de Codificación de Acción Facial. Palo Alto, CA:
Prensa de Psicólogos Consultores.
Ellerbrok A (2011) Biometría lúdica: tecnología controvertida a través de la lente del juego.
Sociological Quarterly 52 (4): 528–547.
Facepción (2021) Facepción. Disponible en: https://www.faception.com (consultado el 10 de junio de 2021)
Feathers T (2021) Esta aplicación afirma que puede detectar 'Confiabilidad'. no puede Vicio. Disponible en: https://
www.vice.com/en/article/akd4bg/this-app-claims-it-can-detect-trustworthiness-it cant (consultado el 1 de agosto de
2021)
Fedorova K (2020) Tácticas de interfaz: Codificación del afecto en el arte y la tecnología. cambridge,
MA: Prensa del MIT.
Frosh P (2009) El rostro de la televisión. Los Anales de la Academia Estadounidense de Ciencias Políticas y Sociales
625 (1): 87–102.
Gates KA (2011) Nuestro futuro biométrico: tecnología de reconocimiento facial y la cultura de la vigilancia. Nueva York,
Nueva York: Prensa de la Universidad de Nueva York.
Goffman E (1955) Sobre el trabajo facial: un análisis de los elementos rituales en la interacción social. Psiquiatría
18(3): 213–231.
Goffman E (1959) La presentación del yo en la vida cotidiana. Nueva York, NY: Doubleday.
Goffman E (1967) Ritual de interacción: Ensayos sobre la interacción cara a cara. New Brunswick, Nueva Jersey:
AldineTransaction.
Gunning T (1997) En tu cara: fisonomía, fotografía y la misión gnóstica de las primeras películas.
Modernismo/ Modernidad 4(1): 1–29.
Guzman AL (2018) ¿Qué es la comunicación hombre-máquina? En: Guzmán AL (ed.)
Comunicación hombre-máquina: repensar la comunicación, la tecnología y nosotros mismos.
Nueva York, NY: Peter Lang, págs. 1–28.
Guzman AL y Lewis SC (2020) Inteligencia artificial y comunicación: una agenda de investigación de comunicación entre
humanos y máquinas. Nuevos medios y sociedad 22 (1): 70–86.
Harwell D (2019) Un algoritmo de escaneo facial decide cada vez más si mereces el trabajo.
El Correo de Washington. Disponible en: https://www.washingtonpost.com/technology/2019/10/22/ai-hir ing-face-
scanning-algorithm-increasingly-decides-whether-you-deserve-job (consultado el 1 de agosto de 2021)

Ho DYF (1976) Sobre el concepto de rostro. Revista estadounidense de sociología 81 (4): 867–884.
Hollister S (2019) Según los informes, los contratistas de Google se dirigieron a las personas sin hogar para el
reconocimiento facial del píxel 4. El borde. Disponible en: https://www.theverge.com/2019/10/2/20896181/google-
con tractor-reportedly-targeted-homeless-people-for-pixel-4-facial-recognition (consultado el 1 de agosto de 2021)

Hu HC (1944) Los conceptos chinos de “rostro”. Antropólogo estadounidense 46 (1): 45–64.


Jensen KB y Helles R (2017) Hablando al sistema: redes sociales y comunicaciones de muchos a uno
municación Revista europea de comunicación 32 (1): 16–25.
Kosinski M, Stillwell D y Graepel T (2013) Los rasgos y atributos privados son predecibles a partir de registros digitales
del comportamiento humano. Actas de la Academia Nacional de Ciencias de los Estados Unidos de América
110(15): 5802–5805.
Machine Translated by Google

654 Medios, cultura y sociedad 44(4)

Lee-Morrison L (2019) Retratos de reconocimiento facial automatizado: sobre formas maquínicas de ver el
rostro. Bielefeld: Transcript Verlag.
Leslie D (2020) Comprender el sesgo en las tecnologías de reconocimiento facial: un explicador. Instituto Alan
Turing. Disponible en: https://doi.org/10.5281/zenodo.4050457 (consultado el 1 de agosto de 2021)

Manusov V y Patterson ML (eds) (2006) El manual Sage de comunicación no verbal.


Thousand Oaks, CA: SAGE.
McCosker A y Wilken R (2020) Automatización de la visión: el impacto social de la nueva conciencia de la
cámara. Londres: Routledge.
Mehrabian A (2017) Comunicación no verbal. Londres: Routledge.
Paglen T (2016) Imágenes invisibles (tus imágenes te están mirando). La Nueva Consulta. Disponible en: https://
thenewinquiry.com/invisible-images-your-pictures-are- looking -at-you/ (consultado el 1 de agosto de 2021)

Pinchevski A (2016) El rostro como medio. En: Pearl S (ed.) Imágenes, Ética, Tecnología. Nuevo
York, Nueva York: Routledge, págs. 193–201.
Qi X (2011) Rostro: un concepto chino en una sociología global. Revista de sociología 47 (3): 279–295.
Raviv S (2020) La historia secreta del reconocimiento facial. CABLEADO. Disponible en: https://www.wired.
com/story/secret-history-facial-recognition (consultado el 1 de agosto de 2021)
Rettberg JW (2017) Ciudadanos biométricos: adaptando nuestros selfies a la visión artificial. En: Kuntsman A
(ed.) Selfie Ciudadanía. Cham: Palgrave Macmillan, págs. 89–96.
Sekula A (1986) El cuerpo y el archivo. 39 de octubre : 3–64.
Senft TM y Baym N (2015) ¿Qué dice el selfie? Investigando un fenómeno global.
Revista de Comunicación Internacional 9: 1588–1606.
Song Y y Luximon Y (2020) Confianza en el agente de IA: una revisión sistemática de la antropomorfa facial
confiabilidad para el diseño de robots sociales. Sensores 20(18): 5087.
Stark L (2019) El reconocimiento facial es el plutonio de la IA. XRDS: Crossroads, la revista ACM para
estudiantes 25 (3): 50–55.
Turk M y Pentland A (1991) Eigenfaces para el reconocimiento. Revista de neurociencia cognitiva
3(1): 71–86.
Wang Y y Kosinski M (2018) Las redes neuronales profundas son más precisas que los humanos para detectar
la orientación sexual a partir de imágenes faciales. Revista de personalidad y psicología social 114 (2):
246–257.
Zhang CX, Pearce P y Chen G (2019) No perder nuestro rostro colectivo: la identidad social y las reflexiones de
los turistas chinos sobre el comportamiento incivilizado. Gestión Turística 73: 71–82.
Zhao S y Zappavigna M (2018) Más allá del yo: la intersubjetividad y la interacción semiótica social
pretación de la selfie. Nuevos medios y sociedad 20 (5): 1735–1754.
Zivkovic T (2020) Acerca de la cara: Relaciones de envejecimiento y muerte en familias inmigrantes chinas.
Ciencias Sociales y Medicina. DOI: 10.1016/j.socscimed.2020.112827.

Biografía del autor


Taina Bucher es profesora asociada de medios y comunicación en la Universidad de Oslo. Es autora de
SI. . .ENTONCES: Poder algorítmico y política (Oxford University Press, 2018) y Facebook (Polity Press, 2021).

También podría gustarte