Está en la página 1de 7

ESCUELA POLITÉCNICA NACIONAL

FACULTAD DE INGENIERÍA DE SISTEMAS


INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

Tema:

Análisis de Tweets

Objetivos:

 Aprender el uso de las herramientas de análisis de tweets para obtener datos relevantes
de ellos.
 Analizar temas de interés social con la herramienta seleccionada.

Marco teórico:

El análisis de sentimientos o sentiment analysis es el estudio por el cual se determina la opinión


de las personas en Internet sobre algún tema en específico, prediciendo la polaridad de los
usuarios (positivo, negativo, neutro, etc), abarcando temas que van desde productos, películas,
servicios a intereses socioculturales como elecciones, guerras, fútbol, etc.
La plataforma escogida fue Twitter, debido a que es una de las redes sociales más usadas en la
actualidad. Se analizarán tweets relacionados a la violencia contra la mujer y se obtendrán las
respuestas de impacto de los usuarios que opinen de esta temática.
Para clasificar los tweets ha escogido una serie de términos relacionados al tema el cual ha sido
la violencia contra la mujer, se tomó en cuenta las siguientes palabras clave para realizar el
escaneo de tweets: violencia contra la mujer, acoso a la mujer, violencia de género,
discriminación de género, machismo, feminismo, sexismo, acoso sexual, xenofobia, maltrato a
las mujeres, mujer, Androcentrismo, Derechos Reproductivos, Patriarcado, Empowerment.
Todas estas palabras clave se han tomado de la siguiente referencia:
http://www.mujeresenred.net/spip.php?article1301 [1].

Desarrollo de la práctica:

Para la presente práctica se ha hecho uso de la herramienta 25Trends, la cual analiza de forma
rápida y visual los temas de interés personal en la red social Twitter.

Este servicio web funciona para usuarios que tengan la necesidad de realizar análisis no tan
profundos de cierto tema o tendencia. Este análisis generalmente empieza con la escritura de
una etiqueta o lo que se conoce como hashtag. Dicho término sirve para que la herramienta
comience a recopilar información necesaria y genere gráficas junto con otros datos útiles para
el usuario.

En la gráfica generada, la cual es interactiva también, veremos los temas más destacados del
momento acerca del término de búsquedas introducido, de manera que se pueda conocer el
porcentaje de tweets positivos, neutrales o negativos relacionados con el término buscado.
Adicionalmente, debajo de la gráfica generada por la herramienta, se pueden observar los
enlaces hacía los tweets más destacados o “polémicos”.
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

Dicho de otra manera, 25Trends es una herramienta de análisis que permite a un cierto usuario
conocer los aspectos que se están diciendo acerca de un tema en cuestión. Las ventajas de este
recurso son principalmente su rapidez y facilidad de uso.

El enlace hacía la página web de 25trends,http://twitter.25trends.me/services/twitter/public/,


siempre se encuentra disponible y funcional. Además, esta herramienta web trabaja
directamente con las API’s de Twitter gracias a la función Applications Tool propia de Twitter.

 La página principal de 25trends tiene como campo inicial el ingreso de la palabra a


buscar. Como se mencionó anteriormente, la palabra ingresada aquí hace referencia al
tema que se quiere investigar.

 En este caso, se va analizará la palabra #LeninMoreno (etiqueta tipo hashtag) como se


muestra a continuación.

 En la parte izquierda de la figura se pueden aprecias las distintas tendencias generadas


alrededor de este tema.
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

 En la parte de derecha se puede ver el estado de cada tema.

Análisis de Resultados

En la lista de tendencias de temas se obtiene etiquetas de los siguientes colores:

Rojo : Negativo

Verde: Positivo

Azul : Neutro
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

Para demostrar los sentimientos de negatividad por parte de las personas, se ha escogido la
palabra “traidor”. Es necesario indicar que las palabras escogidas por los practicantes no hacen
alusión a ninguna preferencia política, únicamente se escogen los términos con el fin de poder
alcanzar el objetivo de esta práctica académica.

2 3
1

4 5 6 7

Después de analizar la muestra de tweets negativos, se obtiene la siguiente tabla, pudiendo ver
que la herramienta ha tenido un fallo con la predicción de 2 tweets.
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

Número de Predicción Predicción


Twitter dada Real
1 Negativa Negativa
2 Negativa Negativa
3 Negativa Positiva
4 Negativa Negativa
5 Negativa Negativa
6 Negativa Negativa
7 Negativa Positiva

En contraparte a la anterior, ahora se analizan los sentimientos positivos por parte de las
personas involucradas en esta tertulia social. Para fines de demostración, se ha usado la palabra
“moreno”.

Después de analizar la muestra de tweets positivos, se obtiene la siguiente tabla, pudiendo ver
que la herramienta ha fallado con la predicción de 3 tweets.

Número de Predicción Predicción


Twitter dada Real
1 Positiva Positiva
2 Positiva Negativa
3 Positiva Positiva
4 Positiva Positiva
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

5 Positiva Negativa
6 Positiva Positiva
7 Positiva Positiva
8 Positiva Positiva
9 Positiva Negativa
10 Positiva Positiva

Finalmente para poder analizar la existencia de tweets relacionados a sentimientos neutros, se


ha utilizado la palabra “ gobierno”.

Después de analizar la muestra de tweets neutros, se obtiene la siguiente tabla, pudiendo


apreciar que la herramienta ha fallado con la predicción de 1 tweet.

Número de Predicción Predicción


Twitter dada Real
1 Neutro Neutro
2 Neutro Neutro
3 Neutro Positivo
4 Neutro Neutro
5 Neutro Neutro
6 Neutro Neutro

Clasificación de Texto:

Positivo Negativo
Positivo 7 3 10
Negativo 2 5 7
9 8 17

Exactitud: (a+d)/(a+b+c+d)

(7+5)/17= 0.706
ESCUELA POLITÉCNICA NACIONAL
FACULTAD DE INGENIERÍA DE SISTEMAS
INGENIERÍA DE SISTEMAS INFORMÁTICOS Y DE COMPUTACIÓN

Recall: r=a/(a+c)

7/(7+2)=0.778

Precisión: p=a/(a+b)

7/(10)=0.7

Noise: 1-precisión

1-0.7=0.3

F-medida, compromiso entre r y p: F1=2rp/(r+p)

2(0.778*0.7)/(0.778+0.7)=0.73

Conclusiones y recomendaciones:
 Se ha logrado aprender bastantes aspectos de la herramienta seleccionada, además de
que se ha aprendido acerca de la dinámica de funcionamiento de otras herramientas
similares.
 Se ha logrado exitosamente analizar las distintas reacciones que las personas tienen en
la red social Twitter acerca de un tema en específico.
 Twitter es una de las redes sociales más aptas para este tipo de análisis gracias a su
sistema de etiquetado, el cual permite realizar enlaces de manera eficaz y precisa.
 Las herramientas de análisis de sentimientos generalmente son orientadas hacia
servicios web, lo cual implica que si se quiere hacer uso de estas el usuario debe tener
constante conexión a internet.
 La mayoría de las herramientas de análisis de sentimientos son pagadas, por lo cual los
estudiantes deben recurrir a herramientas libres o gratuitas para poder realizar
prácticas académicas.
 La cantidad de Tweets analizados como falsos positivos ha sido realmente baja, por lo
cual se podría aseverar que la herramienta tiene alta precisión.
 Para poder realizar un mejor análisis se recomienda al estudiante intentar buscar temas
de interés actual y masivo.

Bibliografía:

[1]"Sentiment Analysis: Concept, Analysis and Applications", Towards Data Science, 2018.
[Online]. Available: https://towardsdatascience.com/sentiment-analysis-concept-analysis-and-
applications-6c94d6f58c17. [Accessed: 25- Jul- 2018].

También podría gustarte