Está en la página 1de 1

Identicacin de Comunidades Mediante Anlisis Tpicos en la red o a o social Twitter - (ICoMATT)

Wherner Cruz C.a , Rodrigo Salasb ,Carlos F. Henr quezc , and Jun Zamorad a
a

Universidad de Valparaiso/presenter, Bolivia, Email: cruz.industrial@gmail.com


b,c d

Universidad de Valparaiso, Chile

Universidad Federico Santa Mar Chile a,

Las redes sociales se han convertido en una importante fuente de informacin donde los usuarios utilizan este o medio para compartir ideas, noticias y sentimientos respecto a algn tema. Twitter, un servicio de microblogu ging1 permite registrar mensajes de hasta 140 caracteres. El ujo de estos mensajes perm congurar una red te de interaccin entre usuarios y comunidades, la cual pueden ser representada por un modelo de grafo dirigido. o Distintos tpicos generan discusin localizada de baja, mediana o alta intensidad, la cual puede constituir la o o emergencia de diversas comunidades temticas de usuarios [Charu (2011)]. En este trabajo se resuelve el problea ma del descubrimiento de dichas comunidades mediante un anlisis probabilistico de tpicos y la representacin a o o de un esquema que perm agrupar usuarios de Twitter segn tpicos de inters comn. ta u o e u El anlisis probabilistico de tpicos tiene por objetivo encontrar el mejor conjunto de variables latentes (Tpia o o cos), a partir de mensajes de texto. Los parmetros de inters son: la distribucin de palabras sobre tpicos y a e o o la distribucin de tpicos sobre el conjunto de mensajes etiquetados, para el cual [Ramage&Hall (2011)] introo o duce el modelo de asignaciones latentes Labeled - Latent Dirichlet Allocation L-LDA basado en la distribucin o conjunta de una funcin de densidad Dirichlet, la estimacin de los parametros en custin se realiza mediante o o o la estimacin de maxima verosimilitud, v algoritmo Gibb sampling. o a La identicacin de tpicos latentes permitir identicar y agrupar usuarios con similares tpicos de inters, los o o a o e cuales constituyen comunidades. En este trabajo se presentan los resultados de un anlisis y procesamiento de mensajes de texto extraidos desde a la red social Twitter en la regin de Chile, la cul se aborda desde la recoleccin y pre-procesamiento de datos, o a o realizado en torno a una aplicacin en lenguaje de programacin Python, administracin de la base de datos, o o o que consiste en la seleccin, limpieza y transformacin de variables con el soporte del software estadistico Stata o o 11.0, la implementacin del modelo para el anlisis de tpicos se realizar en base a la aplicacin desarrollada o a o a o por [Ramage&Hall (2011)] (tmt 0.4.0), nalmente la identicacin de grupos de personas que inters comn o e u o tambien denominado comunidades se realiza mediante una de las herramientas que permite anlizar redes a sociales como es Gephi.

Referencias
[Charu (2011)] Charu Aggarwal (2011); Social Network Data Analitics; Springer,2011 [Ramage&Hall (2011)] Daniel Ramage, Susan Dumais, Dan Liebling Characterizing Microblogs with Topic Models AAAI Conference on Weblogs and Social Media, :(www.aaai.org)

1 http://es.wikipedia.org/wiki/Microblogging

También podría gustarte