Está en la página 1de 15

El análisis de los discursos sociales en

épocas de big data: una experiencia


interdisciplinar

Natalia Raimondo Anselmino


Ana Laura Cardoso
Alejandro Sambrana
José Rostagno
Objetivos:

 Describir el tipo de contenido difundido, la frecuencia de


publicación y las interacciones obtenidas en @clarincom y
@lanacion.
 Indagar los modos de composición de los posteos, identificando
componentes elementales y sus relaciones, durante el período
2010-2015.
 Analizar regularidades en términos de estrategias discursivas en los
posteos publicados en las cuentas seleccionadas, teniendo en
cuenta rasgos retóricos, temáticos y enunciativos.
Diseño metodológico híbrido:
 Labores artesanales propias del análisis sociosemiótico.

› Estudio empírico de la puesta en sentido.

+ › Análisis discursivo que recae en el nivel de la


enunciación.
› Se identifican y describen operaciones que remiten a
procesos.

 Análisis de datos cualitativo y cuantitativo proveniente de las


ciencias computacionales.
› Aplicación de métodos computacionales para recopilación, pre-procesamiento,
procesamiento y visualización de datos y metadatos.
› Confección de vistas minables.
› Automatización de procedimientos de análisis mediante elaboración de
herramientas computacionales y algoritmos de clustering.
Diferentes instancias de la colaboración:

 Configuración de los corpus de análisis.

 Construcción de un meta-lenguaje interdisciplinario y


reflexión sobre niveles de observación.

 Desarrollo de herramientas informáticas para la


automatización de procedimientos.
Configuración del corpus:
 COSPUS DE BASE: 1.129 posteos (534 de Clarín y 595 de La Nación)
seleccionados con criterios de aleatoriedad.

Año Lunes Martes Miércoles Jueves Viernes Sábado Domingo


2010 25-oct-10 26-oct-10 27-oct-10 28-oct-10 29-oct-10 30-oct-10 31-oct-10
2011 05-dic-11 06-dic-11 07-dic-11 08-dic-11 09-dic-11 10-dic-11 11-dic-11
2012 13-feb-12 14-feb-12 15-feb-12 16-feb-12 17-feb-12 18-feb-12 19-feb-12
2013 15-abr-13 16-abr-13 17-abr-13 18-abr-13 19-abr-13 20-abr-13 21-abr-13
2014 23-jun-14 24-jun-14 25-jun-14 26-jun-14 27-jun-14 28-jun-14 29-jun-14
2015 03-ago-15 04-ago-15 05-ago-15 06-ago-15 07-ago-15 08-ago-15 09-ago-15

 Recopilación y sistematización automática del corpus mediante Netvizz.


 Confección de planilla enriquecida artesanalmente que, además de los
datos recopilados por la App, comprende variables ad hoc: localización
geográfica, género periodístico, temática de referencia, temporalidad de
los acontecimientos presentados y modalidad discursiva prevalente.
Configuración del corpus:

 CORPUS TOTAL: universo completo de posteos publicados por las


cuentas entre 2010 y 2015: 54.742 posteos (29.341 de Clarín y
25.401 de La Nación).
 Base de datos MySQL construida con el gestor SQLyog, en la cual se
sistematizaron las planillas de cálculo de ambos corpus, con la
ayuda de un módulo para extracción, transformación y carga de
datos de Pentaho.
 A partir de dos herramientas de minería de datos, RapidMiner y R,
se realizó un análisis univariante y multivariante, con el fin de
reconocer tendencias en el comportamiento de los datos.
Prerrequisitos de la labor interdisciplinaria:

 Meta-lenguaje interdisciplinario: construcción de un


vocabulario común.

 Articulación entre niveles de observación: ensamble del


análisis detallado de nivel micro con la búsqueda de
patrones e información en el conjunto de datos y el
enfoque orientado a la obtención de modelos
matemáticos propios de la las ciencias de la
computación, en particular de la minería de datos.
Automatización de procedimientos:

 Ciertos traspiés durante el proceso investigativo derivaron en


el desarrollo de herramientas computacionales y la
aplicación de algoritmos de clustering en pos de automatizar
algunos procedimientos.

 Mediante herramientas y algoritmos que simulan el


comportamiento de un operador humano, se ejecutan
operaciones que no requieren la intervención constante de
dicho operador.
Herramientas computacionales:

 1) buscarTitulosFacebook:

Permite acceder
automáticamente a un
conjunto posteos de Facebook
para extraer los hashtags,
menciones y títulos de enlace
que los componen, y vuelca la
información recolectada en un
archivo de texto.

 https://github.com/Departamento-Sistemas-UTNFRRO/buscarTitulosFacebook
Herramientas computacionales:
 2) buscarEnPortalesDiarios:
Dado un conjunto de enlaces-noticia permite recolectar
automáticamente datos del portal:

Fecha, hora de publicación,


título, volanta, bajada,
copete, sección del diario
donde se publicó y cuerpo
del texto. 

 https://github.com/Departamento-Sistemas-UTNFRRO/buscarEnPortalesDiarios
Herramientas computacionales:

 3) buscarLinksRotos:
Automatiza la búsqueda
en Google de contenido
faltante de una vista
minable, utilizando otros
datos provenientes de la
misma y selecciona el de
mayor similitud.

 https://github.com/Departamento-Sistemas-UTNFRRO/buscarLinksRotos
Herramientas computacionales:

 4) buscarPosteosFacebook:
Reemplaza a Netvizz, luego de que dejara de funcionar a
causa de cambios en las políticas de privacidad de
Facebook.
Simula la navegación de un usuario en las páginas de FB y
recupera tanto los posteos como los compartidos.

Desventaja: Requiere más recursos y es más lento que el


método anterior.
Corpus 2016-2017:

 Corpus Total: Incluye 15.299 posteos publicados por


las cuentas entre 2016 y 2017 (9.727 de Clarín y 5.572
de La Nación)
 Corpus de Base: En progreso, clasificar las variables ad
hoc de un paquete de posteos.
 Compartidos: Obtener los compartidos de cada posteo.
Algunos resultados:
 Raimondo Anselmino, N., Sambrana, A., Cardoso, A y Rostagno, J (en evaluación) Recursos
paratextuales y paralingüísticos en las fanpages de los periódicos argentinos Clarín y la Nación.
Atributos del discurso de la prensa en las redes.
 Raimondo Anselmino, N. (2018) Prensa online y redes sociales en Internet: Notas sobre la
circulación de los discursos mediáticos contemporáneos en Facebook. En Castro, P. (org.) A
circulação discursiva e transformação da sociedade, Campina Grande: Eduepb.
 Raimondo Anselmino, N., Cardoso, A., Rostagno, J. y Sambrana, A (2018) El discurso de la
prensa argentina en tiempos de algoritmos: una mirada diacrónica sobre la composición de
posteos en las fanpages de Clarín y La Nación. Âncora, Revista Latino-americana de Jornalismo,
Vol. 5(1).
 Raimondo Anselmino, N., Cardoso, A y Rostagno, J (2018) Articulación artesanal-
computacional para el estudio interdisciplinario de posteos en cuentas de Facebook. Relato de
una experiencia asequible. En Anales del Simposio Argentino sobre Tecnología y Sociedad, 47º
Jornadas Argentinas de Informática.
 Raimondo Anselmino, N., Sambrana, A. y Cardoso, A. (2017) Medios tradicionales y redes
sociales en Internet: un análisis de los posteos compartidos por los diarios argentinos Clarín y
La Nación en Facebook (2010-2015). Revista Astrolabio. Nueva Época, n° 19.
¡Muchas gracias!
nraimondo@conicet.gov.ar
cardosoalaura@gmail.com
alesambrana@gmail.com
joserostagno@hotmail.com

También podría gustarte