Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Una vez se han obtenido los valores de las 3 probabilidades para cada
uno de los tuits se procede a guardar la información en una base de datos
relacional con los siguientes campos:
● ID: identificador único de cada tuit.
● Text: El texto contenido en cada tuit.
● Positive: la probabilidad de que cada tuit sea positivo.
● Negative: la probabilidad de que cada tuit sea negativo.
● Neutral: la probabilidad de que cada tuit sea neutro.
Utilizando Python podemos cargar los datos y ver qué pinta tienen:
Aquí vemos que los campos Positive, Negative y Neutral son de tipo
float64, puesto que contienen números decimales. Mientras que ID es de
tipo int64, números enteros, ya que es el día del mes. De forma similar
podemos obtener estadísticas básicas sobre los datos agregados:
Aquí disponemos de la siguiente información:
● hay 30 filas con datos (count).
● la media, desviación típica, mínimo valor, máximo valor, los 3
cuartiles (25%, 50% y 75%).
Aunque son estadísticas simples ya podemos extraer algo de información,
como que priman las opiniones positivas frente a las negativas y neutras.
Aunque esta información es una foto estática y no nos dice nada de la
evolución temporal.
Explotación de resultados.
Para representar los datos del análisis de sentimientos el equipo de ciencia
de datos decide realizar una visualización sencilla en base a dos ejes:
● en el eje horizontal dispondremos de los días del mes en el que
hemos recogido los tuits, numerados del 1 al 30.
● en el eje vertical representaremos las probabilidades agregadas
para los tres casos, Positive, Negative y Neutral.
Observamos que se han elegido colores fácilmente identificables con la
información que representan: verde para sentimientos positivos, azul
para neutros y rojo para negativos.