Documentos de Académico
Documentos de Profesional
Documentos de Cultura
___________________________________________________________________________________________________________________
Resumen
Una de las principales demandas que la industria con relación al análisis de redes
sociales y fuentes abiertas es el análisis sentimental, históricamente el análisis
sentimental se ha basado en métodos estadísticos tradicionales, otra opción que hace
algunos años hemos venido desarrollando es el análisis sentimental basado en redes
neuronales, este documento busca dar una introducción y referencia a este tópico.
___________________________________________________________________________________________________________________
Hasta hace 5 años, era posible dar una aproximación de la cantidad de información que
se generaba en Internet en un día, minuto, etc. En una conferencia, Eric Schmidt (2011)
el entonces director de Google, afirmó que la humanidad había creado hasta 2003 una
cantidad equivalente a 5 Exabytes, lo cual para 2011 ya se generaba cada dos días[1].
Año con año, nuestras necesidades y costumbres cada vez más ligadas al uso de
Internet, fueron acelerando el crecimiento de esta estimación de manera inimaginable y
para 2016, es prácticamente imposible saber la cantidad total de información que
generamos por minuto en Internet.
Tan sólo las estadísticas para 2015 muestran que en los principales sitios de Internet
como Facebook, se compartían aproximadamente 3.3 millones de post, se hacían 3.1
millones de búsquedas en Google, se enviaban 44.4 millones de mensajes en WhatsApp
y se subían 400 horas de video en Youtube (ilustración 1).
Cada vez que hacemos uso de estos sitios en Internet estamos compartiendo y utilizando
información; transmitimos emociones, opiniones, gustos y disgustos, que “hablan” sobre
nosotros y nuestra forma de vida. Un post en Facebook Twitter, Intsgram, etc la mayoría
de las veces describe cómo nos sentimos hoy, dónde estamos, qué vemos, qué
escuchamos, cómo reaccionamos a una noticia nacional o internacional, estamos de
manera directa o indirecta “expresando nuestros sentimientos a través de texto, de
información.
En los últimos años el correcto manejo, explotación y uso de la información que se
genera en Internet se ha vuelto uno de los principales objetivos en el mundo de la
Informática y la Mercadotecnia.
Ilustración 1 Figura, 1. Información que se comparte en Internet por minuto. Adaptación de: What happens onlinein 60
seconds?(2016) http://www.smartinsights.com/internet-marketing-statistics/happens-online-60-seconds/
Las empresas contratan cada vez más a especialistas en el análisis de datos que puedan
traducirles, interpretarles y aportar estadísticas importantes que se guardan de manera
“bruta” en la información y que con un óptimo manejo de ella se convierte en conocimiento
a través del cual podemos saber a qué hora son más utilizadas las Redes Sociales y por
qué tipo de personas, qué productos están siendo los más vendidos en Internet y en qué
país, qué político tiene la preferencia frente a unas próximas elecciones en cualquier parte
del mundo, cuál de las películas actuales en cartelera tiene preferencia y cuál es el
estreno más esperado del año, predecir futuras crisis financieras, entre otras cosas; todos
estos datos basados en lo que la gente sube y conversa de manera pública en Internet,
cómo es que manifiesta “su sentir” ante las situaciones a través de lo que escribe.
Realmente parece que cuando se está frente a un computador, o cualquier dispositivo
móvil con acceso a Internet no imaginamos del todo la cantidad de información que se
genera, procesa y lo bueno que puede resultar de un correcto manejo de ella, como
afirma Viktor Mayer(2013) “La información es el nuevo oro del mundo”. [2]
Es de esperarse que ni para los especialistas, el manejar toda esta información es una
tarea rápida; interpretarla, analizarla y convertirla en estadísticas que sirvan para las
empresas no es tan rápido como la manera en que se generan dichas cantidades de
información y al mismo tiempo crecen. Sin embargo en contraste se encuentra el avance
de la Informática, las Matemáticas, el desarrollo de nuevas disciplinas como Big Data
(grandes volúmenes de datos en español) y en general de la Ciencia.
Actualmente la memoria de cómputo se ha vuelto más barata, hoy es posible almacenar
datos casi sin límite y existe una concurrencia de tecnologías que permiten compartir
millones de ellos en grandes bases de información digital científica, social o industrial.
Estos avances han hecho posible el desarrollo de herramientas informáticas como lo son
las redes neuronales artificiales (RNA) para el rápido y efectivo procesamiento de la
información, y así inclusive, conocer el sentimiento que hay dentro de los textos
Ilustración 2 Modelo de la Neurona Biológica
Ilustración 3 RNA, Modelo simplificado de las Redes Neuronales Biológicas
Las sinapsis y las dendritas de la neurona artificial son las entradas Xi al elemento
procesador (soma) y cada una de estas entradas tiene un peso asociado de conexión
(simulando la fuerza de un conexión biológica determinada). El elemento procesador
multiplica cada entrada por su peso (W) de la conexión y suma generalmente estos
productos, que pasan entonces a la función de la transferencia para generar un resultado
que se transmita por la vía de salida (axón).
Minimización del error: reducción del gradiente, retro propagación, entre otros. La
modificación de pesos está orientada a que el error cometido sea mínimo.
Boltzmann: para redes estocásticas, donde se contemplan parámetros aleatorios.
Hebb: cuando el disparo de una célula activa otra, el peso de la conexión entre ambas
tiende a reforzarse (Ley de Hebb).
Competitivo: sólo aprenden las neuronas que se acercan más a la salida deseada.
Conclusión
Para las empresas, el conocer información de alta calidad que exprese el impacto que
genera en la sociedad, a través de lo que sus clientes, simpatizantes, adversarios,
DSA Soluciones® 2016 Página 5 de 6
Investigación y Desarrollo
seguidores, publican en Internet, puede servir como una poderosa herramienta para
conocer su situación financiera, popularidad, gusto o disgusto por los productos y
servicios que ofrece, así como para predecir futuras crisis.
Contar con este conocimiento es trabajar y procesar de manera adecuada, grandes
cúmulos de información compartida en plataformas como Facebook y Twitter, procesarla
puede no ser una tarea fácil, ya que significa analizar y clasificar como positivos,
negativos o neutros post compartidos en estas plataformas a cerca de determinada
empresa u objetivo.
Dicha tarea compete a los especialistas en Informática, que hacen uso de software
Matemáticas y procesamiento del lenguaje para crear herramientas como las Redes
Neuronales Artificiales, las cuales muestran ser un camino óptimo para el manejo,
procesamiento y clasificación de grandes cantidades de datos.
Referencias
1) Basogain X, Redes Neuronales Artificiales y sus Aplicaciones.(2014). Dpto.
Ingeniería de Sistemas y Automática, Escuela Superior de Ingeniería de Bilbao
2) Meyer V.(2013). Los datos masivos (o big data) son el nuevo oro. Recuperado de
http://www.eldiario.es/turing/Big-data_0_161334397.html
3) Schmidt E.(2011). Was Eric Schmidt Wrong About the Historical Scale of the
Internet?. Recuperado de: http://readwrite.com/2011/02/07/are-we-really-creating-
as-much
4) Toro T. Jara S.(2011) Empresas sentimentales . Recuperado de:
http://www.americaeconomia.com/negocios-industrias/empresas-sentimentales