Está en la página 1de 6

REDES NEURONALES PARA EL ANÁLISIS SENTIMENTAL DE TEXTOS

Karla Saraí Jiménez Martínez y Daniel Trejo Medina


DIVULGACIÓN CIENTÍFICA DSA SOLUCIONES®
Ciudad de México

___________________________________________________________________________________________________________________

Resumen
Una de las principales demandas que la industria con relación al análisis de redes
sociales y fuentes abiertas es el análisis sentimental, históricamente el análisis
sentimental se ha basado en métodos estadísticos tradicionales, otra opción que hace
algunos años hemos venido desarrollando es el análisis sentimental basado en redes
neuronales, este documento busca dar una introducción y referencia a este tópico.
___________________________________________________________________________________________________________________

Hasta hace 5 años, era posible dar una aproximación de la cantidad de información que
se generaba en Internet en un día, minuto, etc. En una conferencia, Eric Schmidt (2011)
el entonces director de Google, afirmó que la humanidad había creado hasta 2003 una
cantidad equivalente a 5 Exabytes, lo cual para 2011 ya se generaba cada dos días[1].
Año con año, nuestras necesidades y costumbres cada vez más ligadas al uso de
Internet, fueron acelerando el crecimiento de esta estimación de manera inimaginable y
para 2016, es prácticamente imposible saber la cantidad total de información que
generamos por minuto en Internet.
Tan sólo las estadísticas para 2015 muestran que en los principales sitios de Internet
como Facebook, se compartían aproximadamente 3.3 millones de post, se hacían 3.1
millones de búsquedas en Google, se enviaban 44.4 millones de mensajes en WhatsApp
y se subían 400 horas de video en Youtube (ilustración 1).

Cada vez que hacemos uso de estos sitios en Internet estamos compartiendo y utilizando
información; transmitimos emociones, opiniones, gustos y disgustos, que “hablan” sobre
nosotros y nuestra forma de vida. Un post en Facebook Twitter, Intsgram, etc la mayoría
de las veces describe cómo nos sentimos hoy, dónde estamos, qué vemos, qué
escuchamos, cómo reaccionamos a una noticia nacional o internacional, estamos de
manera directa o indirecta “expresando nuestros sentimientos a través de texto, de
información.
En los últimos años el correcto manejo, explotación y uso de la información que se
genera en Internet se ha vuelto uno de los principales objetivos en el mundo de la
Informática y la Mercadotecnia.

DSA Soluciones® 2016 Página 1 de 6


Investigación y Desarrollo


Ilustración 1 Figura, 1. Información que se comparte en Internet por minuto. Adaptación de: What happens onlinein 60
seconds?(2016) http://www.smartinsights.com/internet-marketing-statistics/happens-online-60-seconds/

Las empresas contratan cada vez más a especialistas en el análisis de datos que puedan
traducirles, interpretarles y aportar estadísticas importantes que se guardan de manera
“bruta” en la información y que con un óptimo manejo de ella se convierte en conocimiento
a través del cual podemos saber a qué hora son más utilizadas las Redes Sociales y por
qué tipo de personas, qué productos están siendo los más vendidos en Internet y en qué
país, qué político tiene la preferencia frente a unas próximas elecciones en cualquier parte
del mundo, cuál de las películas actuales en cartelera tiene preferencia y cuál es el
estreno más esperado del año, predecir futuras crisis financieras, entre otras cosas; todos
estos datos basados en lo que la gente sube y conversa de manera pública en Internet,
cómo es que manifiesta “su sentir” ante las situaciones a través de lo que escribe.
Realmente parece que cuando se está frente a un computador, o cualquier dispositivo
móvil con acceso a Internet no imaginamos del todo la cantidad de información que se
genera, procesa y lo bueno que puede resultar de un correcto manejo de ella, como
afirma Viktor Mayer(2013) “La información es el nuevo oro del mundo”. [2]
Es de esperarse que ni para los especialistas, el manejar toda esta información es una
tarea rápida; interpretarla, analizarla y convertirla en estadísticas que sirvan para las
empresas no es tan rápido como la manera en que se generan dichas cantidades de
información y al mismo tiempo crecen. Sin embargo en contraste se encuentra el avance
de la Informática, las Matemáticas, el desarrollo de nuevas disciplinas como Big Data
(grandes volúmenes de datos en español) y en general de la Ciencia.
Actualmente la memoria de cómputo se ha vuelto más barata, hoy es posible almacenar
datos casi sin límite y existe una concurrencia de tecnologías que permiten compartir
millones de ellos en grandes bases de información digital científica, social o industrial.
Estos avances han hecho posible el desarrollo de herramientas informáticas como lo son
las redes neuronales artificiales (RNA) para el rápido y efectivo procesamiento de la
información, y así inclusive, conocer el sentimiento que hay dentro de los textos

DSA Soluciones® 2016 Página 2 de 6


Investigación y Desarrollo

compartidos en Internet, para posteriormente aprovechar este conocimiento y poder


inferir datos positivos o negativos (según sea el análisis sentimental u objetivos) que
sirven a las empresas para generar estrategias de ventas, nuevos productos, anunciarse
a ciertas horas, qué sector social está más relacionados con ellos, entre otras cosas.
Desafortunadamente las redes neuronales artificiales aún están poco desarrolladas para
el análisis de textos en español, mientras que para el idioma Inglés ya se encuentran
varios modelos.
¿Cómo funcionan y qué son las Redes Neuronales Artificiales?
A pesar de los pasos agigantados que da la Ciencia, aún no se sabe muy bien cómo es
que hace cosas tan impresionantes nuestra mente, parecen ser el resultado y
combinación de procesos sumamente complejos en varias partes de nuestro cerebro. Al
ser el centro del sistema nervioso, es el órgano encargado de realizar regular y mantener
las funciones del cuerpo, y es también ahí donde se encuentra la mente y la conciencia.
Recibe continuamente información por medio de los sentidos, rápidamente analiza estos
datos y luego responde, controlando las acciones y funciones corporales.
Neurona Biológica
Las neuronas son las células funcionales del tejido nervioso, en los seres humanos hay
aproximadamente 50 a 100 mil millones de estas, que se interconectan formando redes
de comunicación que transmiten señales por zonas definidas del sistema nervioso.
Las funciones más complejas del sistema nervioso, son consecuencia de la interacción
entre redes de neuronas, y no el resultado de las características y actividad de manera
individual.
Las neuronas biológicas consisten en un cuerpo o un soma de la célula que contiene un
núcleo y ramas denominadas dendritas, que transfieren la información vía sinapsis de las
células circundantes al soma, y un axón que lleva el impulso nervioso del soma a la
estructura a la que apunta. (ilustración .2)


Ilustración 2 Modelo de la Neurona Biológica

Las Redes Neuronales Artificiales (RNA)


Están diseñadas como un modelo (matemático) simplificado de la estructura biológica
pues contiene tan sólo sus elementos básicos: sinapsis, dendritas, soma y
axón.(ilustración 3).
DSA Soluciones® 2016 Página 3 de 6
Investigación y Desarrollo


Ilustración 3 RNA, Modelo simplificado de las Redes Neuronales Biológicas

Las sinapsis y las dendritas de la neurona artificial son las entradas Xi al elemento
procesador (soma) y cada una de estas entradas tiene un peso asociado de conexión
(simulando la fuerza de un conexión biológica determinada). El elemento procesador
multiplica cada entrada por su peso (W) de la conexión y suma generalmente estos
productos, que pasan entonces a la función de la transferencia para generar un resultado
que se transmita por la vía de salida (axón).

Las Redes Neuronales Artificiales al margen de "parecerse" al cerebro presentan una


serie de características propias del cerebro [3], es decir:
• Aprenden: pueden cambiar su comportamiento en función del entorno. Se les
muestra un conjunto de entradas y ellas mismas se ajustan para producir unas
salidas consistentes.

• Generalizan: lo hacen automáticamente debido a su propia estructura y naturaleza.


Pueden ofrecer, respuestas correctas a entradas que presentan pequeñas
variaciones debido a los efectos de ruido o distorsión.

• Abstraen: algunas RNA son capaces de abstraer la esencia de un conjunto de


entradas que aparentemente no presentan aspectos comunes o relativos.
El propósito general y principal de la Red es que pueda llevar acabo de forma efectiva una
tarea determinada, mediante su proceso de aprendizaje en el cual va actualizando sus
pesos.
Hay tres conceptos fundamentales en el aprendizaje:
• Paradigma de aprendizaje: información de la que dispone la red.
Supervisado: la red trata de minimizar un error entre la salida que calcula y la salida
deseada (conocida), de modo que la salida calculada termine siendo la deseada.
No supervisado o auto organizado: la red conoce un conjunto de patrones sin conocer la
respuesta deseada. Debe extraer rasgos o agrupar patrones similares.
• Regla de aprendizaje: principios que gobiernan el aprendizaje.
• Algoritmo de aprendizaje: procedimiento numérico de ajuste de los pesos.

DSA Soluciones® 2016 Página 4 de 6


Investigación y Desarrollo

Minimización del error: reducción del gradiente, retro propagación, entre otros. La
modificación de pesos está orientada a que el error cometido sea mínimo.
Boltzmann: para redes estocásticas, donde se contemplan parámetros aleatorios.
Hebb: cuando el disparo de una célula activa otra, el peso de la conexión entre ambas
tiende a reforzarse (Ley de Hebb).
Competitivo: sólo aprenden las neuronas que se acercan más a la salida deseada.

Análisis Sentimental de Textos y RNA

El Análisis Sentimental de Textos se trata de una aplicación de inteligencia que utiliza un


software de textos en lenguaje natural para rastrear lo que se conversa sobre
determinada marca, industria, persona u otros en las redes sociales, sitios web y otras
plataformas electrónicas. Recaudar esta información se combina con un análisis posterior
que valora dichas conversaciones, para luego emitir un informe [4].
Algunos análisis de sentimiento no sólo hacen valoraciones de conversaciones sobre
cuántas y cuáles son las menciones positivas, negativas o neutras que tiene el objeto de
estudio sino también consideran qué persona hace el comentario, pues no es lo mismo un
posteo de un usuario común al de un experto en el tema y opinión. Además el proceso
también puede contemplar reportes en tiempo real, lo que implica generar en algunos
casos oportunidades de negocios para las empresas.
Sin embargo la gran cantidad de fuentes y el elevado volumen de textos con opiniones
hacen que resulte complicado para el usuario seleccionar información de su interés. Por
ello, es necesario desarrollar sistemas de clasificación de opiniones a nivel de aspecto,
que ayuden a los usuarios a tomar decisiones y que, por otro lado, muestren a las
empresas la opinión que los consumidores tienen acerca de sus productos, para
ayudarles a decidir qué deben mantener, qué deben eliminar o qué deben mejorar.
Para este tipo de análisis se utilizan las Redes Neuronales Artificiales, ya que las
capacidades de entrenarse y aprender la hacen una de las herramientas más óptimas
pues al proporcionarle como datos de entrada varias y distintas opiniones (positivas,
negativas, neutras) extraídas de Internet en forma de texto, la red pasará por una etapa
de aprendizaje y tras un número elevado de opiniones distintas y de los tres tipos que se
le proporcionen, modificará sus valores o pesos en sus conexiones por medio de un
algoritmo, así este entrenamiento continuará hasta que la red sea capaz de que al
pasarle cualquier opinión, esta la clasifique como positiva, negativa o neutra según lo que
por sí sola haya aprendido de los datos que al principio le proporcionamos.
Después de obtener esta información se pueden elaborar informes y estadísticas que
sirvan de conocimiento para las Empresas y aplicarlo en distintos beneficios como los ya
mencionados.

Conclusión
Para las empresas, el conocer información de alta calidad que exprese el impacto que
genera en la sociedad, a través de lo que sus clientes, simpatizantes, adversarios,
DSA Soluciones® 2016 Página 5 de 6
Investigación y Desarrollo

seguidores, publican en Internet, puede servir como una poderosa herramienta para
conocer su situación financiera, popularidad, gusto o disgusto por los productos y
servicios que ofrece, así como para predecir futuras crisis.
Contar con este conocimiento es trabajar y procesar de manera adecuada, grandes
cúmulos de información compartida en plataformas como Facebook y Twitter, procesarla
puede no ser una tarea fácil, ya que significa analizar y clasificar como positivos,
negativos o neutros post compartidos en estas plataformas a cerca de determinada
empresa u objetivo.
Dicha tarea compete a los especialistas en Informática, que hacen uso de software
Matemáticas y procesamiento del lenguaje para crear herramientas como las Redes
Neuronales Artificiales, las cuales muestran ser un camino óptimo para el manejo,
procesamiento y clasificación de grandes cantidades de datos.

Referencias
1) Basogain X, Redes Neuronales Artificiales y sus Aplicaciones.(2014). Dpto.
Ingeniería de Sistemas y Automática, Escuela Superior de Ingeniería de Bilbao
2) Meyer V.(2013). Los datos masivos (o big data) son el nuevo oro. Recuperado de
http://www.eldiario.es/turing/Big-data_0_161334397.html
3) Schmidt E.(2011). Was Eric Schmidt Wrong About the Historical Scale of the
Internet?. Recuperado de: http://readwrite.com/2011/02/07/are-we-really-creating-
as-much
4) Toro T. Jara S.(2011) Empresas sentimentales . Recuperado de:
http://www.americaeconomia.com/negocios-industrias/empresas-sentimentales

DSA Soluciones® 2016 Página 6 de 6


Investigación y Desarrollo

También podría gustarte