Está en la página 1de 29

Machine Translated by Google

Análisis emocional de información falsa en Twitter y noticias

B. Ghanem, P. Rosso y F. Rangel (2020). Un análisis emocional de información falsa en medios sociales y artículos de noticias. ACM
Transacciones Tecnología de Internet. 20(2): 1-18
Machine Translated by Google

Análisis emocional

B. Ghanem, P. Rosso y F. Rangel (2020). Un análisis emocional de información falsa en medios sociales y artículos de noticias. ACM
Transacciones Tecnología de Internet. 20(2): 1-18
Machine Translated by Google

Cómo fluyen las emociones en una fake news

Ghanem B., Ponzetto S., Rosso P., Rangel F (2021) FakeFlow: detección de noticias falsas mediante el modelado del flujo de
información afectiva En: Proc. de la 16ª Conferencia del Capítulo Europeo de la Association for Computational Linguistics, EACL 2021
Machine Translated by Google

Esquema

Desinformación
• Noticias falsas y emociones •
Detección multimodal de noticias falsas
• Perfilado de difusores de noticias falsas y teorías de conspiración
Machine Translated by Google

Detección multimodal de noticias falsas

Colecciones:
• MediaEval: publicado como parte de la Verificación de uso multimedia en
Desafío MediaEval
• PolitiFact: tweets que se han recopilado con respecto a las
publicaciones que se publican en PolitiFact y es parte del
Colección FakeNewsNet
• GossipCop: parte de la colección FakeNewsNet

31
Machine Translated by Google

Detección multimodal de fake news: información


textual, visual y semántica

A. Giachanou, G. Zhang y P. Rosso (2020). Detección Multimodal de Fake News con Información Textual, Visual y Semántica. En Actas de la 23.ª Conferencia Internacional
sobre Texto, Habla y Diálogo, TSD '20, páginas 30-38, 2020. Springer
Machine Translated by Google

Resultados de rendimiento

A. Giachanou, G. Zhang y P. Rosso (2020). Detección Multimodal de Fake News con Información Textual, Visual y Semántica. En Actas de la 23.ª Conferencia Internacional
sobre Texto, Habla y Diálogo, TSD '20, páginas 30-38, 2020. Springer
Machine Translated by Google

Detección multimodal de noticias falsas multiimagen

• Los artículos vienen con más de una imagen


• Combinar información visual de más de una imagen

• GossipCop: parte de la colección FakeNewsNet


• 2745 publicaciones de noticias falsas y 2714 publicaciones de noticias reales que contienen al menos
una imagen después de limpiar las imágenes del logotipo y el ícono

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de
datos y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 34
Machine Translated by Google

componente textual

• Representaciones de codificador bidireccional de transformadores (BERT)


• Entrenamiento bidireccional de un Transformador, un mecanismo de atención que aprende
relaciones contextuales entre palabras en un texto

• Base BERT
• El texto rellenado y tokenizado se pasa al modelo BERT para recibir la palabra
vectores

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de datos
y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 35
Machine Translated by Google

componente visual
• El modelo VGG-16 está preentrenado en el
conjunto de datos visuales ImageNet

• Para modelar la información de la secuencia en


la publicación de noticias multi-imagen,
aprovechamos el modelo LSTM
• Vector de estado oculto en cada paso de
tiempo desde la última capa del LSTM
• La secuencia de las salidas ocultas se pasa a
una capa de agrupación media para producir
un solo componente temporal

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de
datos y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 36
Machine Translated by Google

información semántica

• Para cada etiqueta y palabra de texto, usamos las incrustaciones de word2vec para
estimar el vector de 300 dimensiones promediando las incrustaciones • La similitud se
calcula entre la incrustación de etiquetas y la incrustación de texto
usando la similitud del coseno
• La característica de similitud está representada por un vector tridimensional

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de
datos y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 37
Machine Translated by Google

Detección multimodal de noticias falsas multiimagen

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de
datos y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 38
Machine Translated by Google

Resultados de rendimiento

A. Giachanou, G. Zhang y P. Rosso. (2020). Detección multimodal de noticias falsas multiimagen. En Actas de la 7.ª Conferencia internacional IEEE sobre ciencia de
datos y análisis avanzado Sesión especial sobre noticias falsas, bots y trolls, DSAA '20 39
Machine Translated by Google

Esquema

Desinformación
• Noticias falsas y emociones •
Detección multimodal de noticias falsas
• Perfilado de difusores de noticias falsas y teorías de conspiración
Machine Translated by Google

El papel de los usuarios

• ¿Quiénes son los usuarios y por qué


creen y comparten información falsa?
noticias

• Los usuarios juegan un papel


fundamental en todas las diferentes
fases del ciclo de noticias falsas:
desde su creación hasta su propagación .
• Cámaras de eco
• Sesgo de confirmación

• Credibilidad de los usuarios (fuente)


Machine Translated by Google

Propagación de noticias falsas y teorías de la conspiración


Machine Translated by Google

FacTweet: perfiles de cuentas de Twitter de noticias falsas

• Discriminar entre cuentas fácticas y no fácticas en Twitter

• Conjunto de características de las líneas de tiempo de las cuentas de noticias de Twitter al leer
sus publicaciones como fragmentos, en lugar de tratar cada tweet de forma independiente.

• Incrustaciones de palabras (GloVe), estilo, sentimiento, emociones, moralidad (cuidado,


daño, justicia, engaño, lealtad, traición, autoridad, subversión, santidad y degradación)

• LSTM

B. Ghanem, S. Ponzetto y P. Rosso. (2020). FacTweet: elaboración de perfiles de cuentas de twitter de noticias falsas. En Conferencia Internacional sobre Procesamiento Estadístico del 43
Lenguaje y del Habla (págs. 35-45). Saltador.
Machine Translated by Google

FacTweet: perfiles de cuentas de Twitter de noticias falsas

B. Ghanem, S. Ponzetto y P. Rosso. (2020). FacTweet: elaboración de perfiles de cuentas de twitter de noticias falsas. En Conferencia Internacional sobre Procesamiento Estadístico del 44
Lenguaje y del Habla (págs. 35-45). Saltador.
Machine Translated by Google

Difundidores de noticias falsas vs verificadores de hechos

• CheckerOrSpreader se basa en una red neuronal convolucional (CNN)


• CheckerOrSpreader consta de dos componentes diferentes:
• El textual que hace referencia a la palabra incrustaciones •
El componente psicolingüístico del usuario (patrones lingüísticos y puntuaciones de personalidad)

A. Giachanou, E. Ríssola, B. Ghanem, F. Crestani y Paolo Rosso (2020). El papel de la personalidad y los patrones lingüísticos en la discriminación entre los difusores
de noticias falsas y los verificadores de hechos. En Int. Conf. sobre Aplicaciones del Lenguaje Natural a los Sistemas de Información, pp. 181-192. Saltador.
Machine Translated by Google

Difundidores de noticias falsas vs verificadores de hechos


• Patrones lingüísticos: LIWC , un software para asignar texto a 73 lingüísticos psicológicamente significativos
categorías

pronombres (yo, nosotros, tú, ella/él, ellos)
• preocupaciones personales (trabajo, ocio, hogar, dinero, religión, muerte) • enfoque
temporal (pasado, presente, futuro) • procesos cognitivos (causalidad, discrepancia,
tentativa, certeza) • lenguaje informal (palabrotas, asentimiento, falta de fluidez,
muletillas) • procesos afectivos (ansiedad)

• Puntuaciones de personalidad con Big Five


• Apertura a la experiencia (poco convencional, perspicaz, imaginativo) • Escrupulosidad
(organizado, autodisciplinado, ordenado) • Extraversión (alegre, sociable, asertivo) •
Amabilidad (cooperativo, amistoso, empático) • Neuroticismo (ansioso, triste, inseguro)

A. Giachanou, E. Ríssola, B. Ghanem, F. Crestani y Paolo Rosso (2020). El papel de la personalidad y los patrones lingüísticos en la discriminación entre los difusores
de noticias falsas y los verificadores de hechos. En Int. Conf. sobre Aplicaciones del Lenguaje Natural a los Sistemas de Información, pp. 181-192. Saltador.
Machine Translated by Google

Perfilando a los difusores de noticias falsas @ 2020

https://pan.webis.de/

F. Rangel, A. Giachanou, B. Ghanem, P. Rosso (2020). Descripción general de la octava tarea de creación de perfiles de autor en PAN 2020: creación de perfiles

de difusores de noticias falsas en Twitter. Laboratorios y Talleres CLEF 2020, Cuadernos. Actas del Taller CEUR. CEUR-WS.org, vol. 2380
Machine Translated by Google

conjunto de datos

• 500 autores en inglés y en español


• 250 autores difusores de noticias falsas + 250 no
• Cada feed de autor está compuesto por 100 tweets
(los tweets están concatenados)

F. Rangel, A. Giachanou, B. Ghanem, P. Rosso (2020). Descripción general de la octava tarea de creación de perfiles de autor en PAN 2020: creación de perfiles de difusores de noticias falsas en Twitter. Laboratorios

y Talleres CLEF 2020, Cuadernos. Actas del Taller CEUR. CEUR-WS.org, vol. 2380 48
Machine Translated by Google

49
Machine Translated by Google

Resultados

• 66 equipos

• Mejor rendimiento (precisión):

Buda y Bolonyai - n-
gramas - características Pizarro
estilísticas - palabra y char n-gramas
- Conjunto de regresión logística - SVM

F. Rangel, A. Giachanou, B. Ghanem, P. Rosso (2020). Descripción general de la octava tarea de creación de perfiles de autor en PAN 2020: creación de perfiles de difusores de noticias falsas en Twitter. Laboratorios

y Talleres CLEF 2020, Cuadernos. Actas del Taller CEUR. CEUR-WS.org, vol. 2380 50
Machine Translated by Google

Perfilando a los propagadores de las teorías de la conspiración

XAI-DisInfodemics: IA explicable para desinformación y


detección de conspiraciones durante infodemias (PLEC2021-007681)
Machine Translated by Google

Un análisis psicolingüístico

NASAIsReal

A. Giachanou, B. Ghanem, P. Rosso. (2021) Detección de propagadores de conspiraciones utilizando características psicolingüísticas. Revista de
Ciencias de la Información.
Machine Translated by Google

Un análisis psicolingüístico
• Los propagadores tienen nueve veces menos seguidores
• Propagadores menos estados, favoritos y amigos
• Los usuarios verificados tienen más probabilidades de refutar conspiraciones

• Los no propagadores tienen cuentas antiguas


• Los no propagadores tienen una mayor cantidad de estados en comparación con los propagadores.
• Los propagadores tienden a usar más palabrotas

• Los no propagadores exhiben un mayor uso del trabajo, el ocio, el dinero, el hogar y la muerte que los
propagandistas que se preocupan más por la religión .
• Los no propagadores exhiben un mayor uso en causalidad (porque, efecto, por lo tanto) en
comparación con los propagadores
A. Giachanou, B. Ghanem, P. Rosso. (2021) Detección de propagadores de conspiraciones utilizando características psicolingüísticas. Revista de
Ciencias de la Información.
Machine Translated by Google

ConspiDetector

A. Giachanou, B. Ghanem, P. Rosso. (2021) Detección de propagadores de conspiraciones utilizando características psicolingüísticas. Revista de
Ciencias de la Información.
Machine Translated by Google

ConspiDetector

• La función más efectiva es IBM


Perspectivas de personalidad con un rendimiento
de 0,73
• El rendimiento más bajo se logra con las características
del perfil (CNN + Perfil), inferior a la línea de base de
CNN
• El perfil, el sentimiento y la emoción no son útiles

A. Giachanou, B. Ghanem, P. Rosso. (2021) Detección de propagadores de conspiraciones utilizando características psicolingüísticas. Revista de
Ciencias de la Información.

También podría gustarte