HPL-2011-89 en Es

Combinación de métodos basados en Léxico y basado en el
aprendizaje para el Análisis Twitter sentimiento

Lei Zhang, Riddhiman Ghosh, Mohamed Dekhil, Meichun Hsu, Bing Liu
HP Laboratorios
HPL-2011-89
Abstracto:
Con el auge de los microblogs en la Web, las personas han comenzado a expresar sus opiniones sobre una
amplia variedad de temas en Twitter y otros servicios similares. El análisis de sentimientos de entidades
(por ejemplo, productos, organizaciones, personas, etc.) en los tweets (mensajes en Twitter) se convierte
así en una forma rápida y eficaz de medir la opinión pública para la comercialización de negocios o de
estudios sociales. Sin embargo, las características únicas de Twitter dan lugar a nuevos problemas para los
métodos de análisis de emociones actuales, que se centró inicialmente con un amplio corpus dogmático
como comentario. En este trabajo, se propone un nuevo método de análisis de opiniones a nivel de
entidad para Twitter. El método adopta primero un enfoque lexiconbased para llevar a cabo análisis de los
sentimientos de nivel de entidad. Este método puede dar de alta precisión, pero bajo el recuerdo. Para
mejorar la memoria, ecotweets adicionales que son propensos a ser obstinado se identifican
automáticamente mediante la explotación de la información en el resultado del método basado en el
léxico. Un clasificador es entonces entrenado para asignar polaridades a las entidades en los tweets
recientemente identificados. En lugar de ser etiquetados de forma manual, los ejemplos de entrenamiento
son dados por el enfoque basado en el léxico. Los resultados experimentales muestran que el método
propuesto mejora dramáticamente la retirada y el F-score, y supera las líneas de base del estado de la
técnica.
Aprobado para publicación externa

Publicación externa Fecha: 21 de junio de 2011 [texto completo]
Fecha de contabilización interna: 21 de junio de 2011 [texto completo]
Copyright 2011 Hewlett-Packard Development Company, LP
Combinación de métodos basados en Léxico y basado en el
aprendizaje para el Análisis Twitter sentimiento
1; 2 1 1 1 2
Zhang Lei , Riddhiman Ghosh , Mohamed Dekhil , Meichun Hsu , Liu Bing
1 2
Hewlett-Packard Laboratorios Universidad de Illinois en
Chicago
1501 Page Mill Rd., Palo Alto, CA 851 S. Morgan St., Chicago, IL
friddhiman.ghosh, mohamed.dekhil, flzhang3, liubg@cs.uic.edu
meichun.hsug@hp.com
evaluar las opiniones de la gente en Twitter. Como
Abstracto personas de diez hablar de un tweet en diversas
entidades (por ejemplo, productos, organi-
Con el auge de los microblogs en la Web, las zaciones, personas, etc.), se realiza el análisis de
personas han comenzado a expresar sus opiniones a nivel de entidad; es decir, extraemos
opiniones sobre una amplia variedad de opiniones de la gente sobre las entidades espec
temas en Twitter y otros servicios similares. cas en cada tweet en lugar de la opinión acerca de
El análisis de sentimientos de entidades (por todo cada frase o pío conjunto. Suponemos que
ejemplo, productos, organizaciones, las entidades son proporcionados por el usuario,
personas, etc.) en los tweets (mensajes en por ejemplo, él / ella está interesado en las
Twitter) por lo tanto ser-viene de una manera opiniones sobre iPhone (una entidad).
rápida y reflexivo e de medir la opinión
pública para la comercialización de negocios Un método para llevar a cabo análisis de los
o de estudios sociales. Sin embargo, único sentimientos se basa en una función de las palabras
personaje-ticas de Twitter dan lugar a de opinión en su contexto. Opin palabras-ion son
nuevos problemas para los métodos de palabras que se utilizan comúnmente para ex-prensa
análisis de emociones actuales, que se sentimientos positivos o negativos, por ejemplo, \
centró inicialmente con un amplio corpus bueno "y \ malo". El enfoque general, utiliza un
dogmático como comentario. En este diccionario de palabras de opinión para identificar y
trabajo, se propone un nuevo método de determinar el sentimiento ori-entación (positivo,
análisis de opiniones a nivel de entidad para negativo o neutro). El dictio-nario se llama el léxico
Twitter. El primer método adopta un enfoque opinión. El enfoque de utilizar las palabras de opinión
basado en léxico para realizar análisis-ment (léxico) para determinar las orientaciones de opinión
senti-nivel de la entidad. Este método puede se llama el enfoque basado en el léxico de análisis
dar de alta pre-cisión, pero bajo el recuerdo. de sentimientos (Ding et al, 2008; Taboada, et al.,
Para mejorar la memoria, ADDI-cional tweets 2010). Este enfoque es e ciente y se puede emplear
que son susceptibles de ser obstinado son para analizar el texto a nivel de documento, frase o
ed identi automáticamente mediante la entidad. Por tanto, es aplicable a nuestra tarea
explotación de la información en el resultado también. Sin embargo, los datos de Twitter ha
del método basado en el léxico. A desarrollado sus propias características. Algunos de
continuación, se clasifican er capacitado ellos son perjudiciales para el enfoque basado en el
para asignar polaridades a las entidades en léxico. Por ejemplo, emoticons, expresiones Col-
los tweets recién identi-ed. En lugar de ser loquial, abreviaturas, etc., se utilizan con frecuencia
etiquetado manu-aliado, los ejemplos de en tweets. Estas expresiones pueden poseer
entrenamiento son dados por el enfoque orientación-Seman tic / sentimiento, pero que no
basado en el léxico. Los resultados existen en un léxico opinión general. Veamos un
experimentales muestran que el método ejemplo pío, \ compré ayer iPad, simplemente lovvee
propuesto mejora dramáticamente la retirada él :-) "Es claramente ex presiona una opinión positiva
y el F-score, y supera a las líneas de base en el iPad con la palabra \ lovvee" y el
del estado de la técnica. emoticono \ :-)". Pero el Lexicon- método basado
consideraría el tweet como la expresión de ninguna
opinión / neutral en el iPad, ya que no es una palabra
1 Introducción opinión general en el tweet. Esto nos lleva al
Como microblogging y red social, Twitter se ha vuelto problema de recuperación baja para el método
muy popular y ha crecido rápidamente. Un número basado en el léxico, que depende totalmente de la
creciente de personas están dispuestas a publicar presencia de palabras de opinión para determinar la
sus opiniones en Twitter, que está ahora Ered consid orientación sen-timent.
una fuente valiosa en línea para las opiniones. Como modas en Internet. Por otra parte, sus polaridades
resultado de ello, el análisis de opiniones en Twitter pueden ser de dominio dependiente. Estos
es una forma rápida y reflexivo e de medir la opinión problemas hacen que sea difícil para añadir
pública para la comercialización de negocios o de manualmente a la opinión léxico. Sin un léxico
estudios sociales. Por ejemplo, una empresa puede amplio, los resultados de análisis de emociones
obtener retroalimentación oportuna sobre un nuevo hará su er.
producto en el mercado por Alternativamente, se puede aplicar un método
basado en el aprendizaje de máquina para llevar a
cabo análisis de los sentimientos (Pang et al., 2002).
Es decir, formamos una clasificación er sentimiento
para determinar los sentimientos positivos, negativos
y neutros. El método ha sido utilizado con frecuencia
para cationes sentimiento clasificación de ellos debido a algunas di erences sutiles pero
documentos u oraciones. Sin embargo, no es fácil de cruciales. Creemos que nuestro método es más
aplicar en nuestro caso porque manual de etiqueta- deseable para aplicaciones cas-tico debido a su
ción de un gran conjunto de ejemplos pío es un naturaleza de ningún manual en volvement y su
trabajo intensivo y requiere mucho tiempo. Por otra capacidad para adaptarse automáticamente a las
parte, el etiquetado manual de que hay que hacer nuevas modas en el lenguaje, neologismos y
para cada dominio de aplicación, ya que es bien tendencias. Nuestro estudio experimental muestra
sabido que un er sentimiento clasificación puede que el método propuesto mejora dramáticamente la
llevar a cabo muy bien en el dominio que está retirada y el F-score, y supera las líneas de base del
entrenado, pero funciona mal cuando se aplica a un estado de la técnica.
dominio on diferente (Aue y Gamon, 2005).
En este trabajo, se explora un enfoque de análisis 2 Trabajo relacionado
de sentimiento a nivel de entidad a los datos de
La investigación propuesta se encuentra en la zona
Twitter. Nos RST em-táctica de un método basado en
del sentimiento anal-Ysis. Para determinar si un
el léxico aumentada para el análisis a nivel de la
documento o una frase expresa un sentimiento
entidad sentimiento. Aunque este método
positivo o negativo, dos enfoques principales son de
proporciona una buena precisión, la retirada puede
uso común: el enfoque basado en el léxico y el
ser bastante baja. Para mejorar la memoria, hacemos
enfoque basado en el aprendizaje automático.
lo siguiente: Nos primera extraemos algunos
indicadores adicionales (por ejemplo, pertinaces El enfoque basado en el léxico (Hu y Liu 2004,
palabras y Kens-a) mediante la prueba de Chi- Kim y Hovy, 2004; Ding et al, 2008;.. Taboada, et
cuadrado sobre los resultados del método basado en
al, 2010) determina el sentimiento o la polaridad
de la opinión a través de alguna función de las
el léxico. Con la ayuda de los nuevos indicadores
palabras de opinión en el documento o la frase.
pertinaces, los tweets pertinaces adicionales pueden
Como se señaló anteriormente, este método
ser identi cado. Posteriormente, un sentimiento er
puede resultar en una baja recuperación de
clasificación está capacitado para asignar
nuestra entidad a nivel de sentimiento anal-Ysis.
polaridades sentimiento de entidades en los tweets
ed recién identi. Los datos de entrenamiento para la El enfoque basado en el aprendizaje de máquina
clas er-si es el resultado del método basado en el normalmente entrena ERS sentimiento caciones
léxico. Por lo tanto, todo el proceso no tiene el usando características tales como uni-gramos o
etiquetado manual. El enfoque pro-planteado es un bigramas (Pang et al. 2002). La mayoría de las
técnicas utilizan alguna forma de aprendizaje
método no supervisado a excepción del léxico
supervisado mediante la aplicación de técnicas de
dictamen inicial, que está disponible públicamente.
aprendizaje dif rentes tales como Na • cinco Bayes,
La razón por la que funciona nuestra técnica es que
Max-imo Entropía y máquinas de vectores soporte.
las expresiones de sentimiento (incluyendo palabras
Estos métodos requiere etiquetado manual de los
de dominio-espec co de opinión, emoticonos,
ejemplos de entrenamiento para cada dominio de
expresiones coloquiales, abreviaturas, etc.)
aplicación.
dependen del contexto sentimiento. Por ejemplo,
veamos un tweet con una opinión positiva, \ La También hay algunos enfoques que utiliza tanto
película es tan sorprendente. Harry Potter es tan las palabras de opinión / léxico y el enfoque de
Cuteee !!! "Aunque la expresión \ cuteee" no es una aprendizaje. Por ejemplo, Wiebe y Rilo (2005) utilizan
palabra opinión general, si ND es a menudo co- un léxico subjetividad para identificar datos de
produce en la opinión con-textos positivos a través de entrenamiento para el aprendizaje supervisado para
una prueba estadística, podemos inferir que es una cationes subjetividad clasificación. Nuestro trabajo no
opinión positiva indicador. Y el sentimiento clasi-er hace la subjetividad clasi. Una idea similar se aplicó
podría aprender esta pieza de información valiosa en también al sentimiento de clasi comentarios en (Tan
la formación. La prueba estadística y la formación et al., 2008), que clasi ES revisión en dos clases,
necesitan una enorme cantidad de datos, positivos y negativos, pero ninguna clase neutro, lo
que hace que el problema mucho más fácil. Estos
Nuestro método propuesto parece ser similar a enfoques son ap-on diferente de la nuestra: En
varias técnicas existentes, por ejemplo, utilizando un primer lugar, se realiza el análisis de opiniones a
léxico para arrancar el aprendizaje y el aprendizaje nivel de entidad, por lo tanto son de asignación de
de transferencia. Sin embargo, como veremos en la unificación de las polaridades de sentimiento que se
siguiente sección, es totalmente on diferente de hace en un nivel de granularidad ner mucho. En
segundo lugar, nuestra técnica para la asignación de
polaridad es también on diferente ya que nos
ocupamos de tres clases de sentimientos (positivos,
negativo y neutro) y por lo tanto no se puede aplicar
directamente a sus métodos. Debido a la baja
recuperación del enfoque basado en el léxico para
las clases positivos y negativos, muchos de los
tweets neutros ed iden-ti son realmente obstinado.
Por lo tanto tenemos que identificar estos tuits
pertinaces antes de cualquier clasificación ca-ción se
puede realizar. Tanto los métodos existentes no
tienen este paso porque su clase de dos clasi no lo
necesita. Para nosotros, sin embargo, este paso es
crucial.
Aunque la mayoría de los métodos de análisis de
los sentimientos se pro-posaron para documentos
grandes pertinaces (por ejemplo, comentarios,
blogs), algunos trabajos recientes se ha ocupado de
microblogs.
1
http://twendz.waggeneredstorm.com/
2
http://twittersentiment.appspot.com/
3
http://www.tweetfeel.com/
Figura 1: Descripción de la arquitectura

Algoritmo
El aprendizaje supervisado es el enfoque dominante.

(Park y Paroubek, 2010) construyeron un sentimiento
er clasificación para clasificar los tweets en clases
positivas, negativas y neutras. (Barbosa y Feng, 2010)
propusieron un método clasi de dos pasos. Se
clasifican en primer lugar los tweets como subjetiva y
objetiva, y luego clasifica los tweets ES subjetivos
como positivos o negativos. En (Davidov et al., 2010),
muchas de las características de Twitter y
convenciones del lenguaje (por ejemplo, hashtags y
Smiley) fueron utilizados como características.
También hay varios sistemas de análisis en línea
1
Twitter sen-timent (por ejemplo Twend , Twitter Sen-
2 3
timent Y Tweetfeel ). Estos enfoques utilizados
principalmente aprendizaje supervisado. Nuestro
método no necesita datos de entrenamiento
etiquetados manualmente su-o vigilar atentamente.
Mientras que nuestro trabajo está relacionado con la
transferencia de aprendizaje (Pan et al, 2010;.. Tan et
al, 2008), que utiliza los resultados de aprendizaje de
un dominio a ayudar a aprender en otro dominio, es
signi cativamente on diferente ya explotamos un hecho
léxico sentimiento y lo utilizan para clasi en cualquier
dominio sin ningún tipo de etiquetado de los datos de
entrenamiento.
3 La técnica propuesta
En esta sección se presenta el enfoque propuesto.
La figura 1 ofrece una visión arquitectónica de
nuestro algoritmo sentimiento anal-Ysis.
Vamos a discutir las técnicas en las siguientes
sec-ciones. Antes de profundizar en los detalles de
los algoritmos, vamos a echar un vistazo a los
primeros datos de Twitter y se comentan sus
características.
datos 3.1Twitter Detección Tipo 3.3.1Sentence
Twitter ha desarrollado sus propias convenciones del detección de tipo de oración es un paso especial
lenguaje. para el análisis de los tweets. Hay tres tipos
Los siguientes son ejemplos de convenios de principales de sentencias en los tweets:
Twitter.
(i) oración declarativa: se establece una vista de
1. \ RT" es un acrónimo de retweet, que se pone la au-thor, por ejemplo, \ esto es un muy buen
delante de un tweet para indicar que el usuario teléfono ".
es la repetición-ción o volver a colocar.
2. \ #" Llamó el hashtag se utiliza para marcar,

organizar o los tweets ltro de acuerdo con los
temas o categorías.
3. \ @ Usuario1" representa que un mensaje es una

re-capa a un usuario cuyo nombre de usuario es \
usuario1" .
4. Emoticonos y expresiones coloquiales son fre-

cuentemente utilizados en los tweets, por
ejemplo, \ :-) "\ lovvve", \ lmao".
5. Los enlaces web externos (por ejemplo

http://amze.ly/8K4n0t) también se encuentran
comúnmente en los tweets para referirse a
algunas fuentes externas.
6. Longitud: Tweets están limitados a 140 caracteres.

Esta es on diferente a partir de corpus dogmático
habitual, tal como revisiones y blogs, que son por
lo general mucho tiempo.
Otra característica única de datos de Twitter com-

pelado al otro corpus dogmático es su volumen. Se
estima que la gente publica cerca de 60 millones de
tweets cada día y el número sigue aumentando
rápidamente.
3.2Preprocessing
Antes de iniciar el análisis de los sentimientos,
tenemos que hacer un poco de limpieza de datos.
Hemos eliminado retweets (duplicados que no añaden
ningún valor para nuestro propósito) cuyo texto se
inicia con \ RT "También restauramos abreviaturas
populares a su forma original utilizando un léxico de
abreviaturas correspondientes (por ejemplo, \ wknd" a \
fin de semana ") . enlaces y los nombres de usuario
(ed signi por @ signo externo) son eliminados. Sin
embargo, signos de puntuación se mantienen desde
PEO-plo a menudo expresan el sentimiento con fichas
como \ :) "\ :-)". Después de la limpieza, realizamos
segmenta frase tion, que separa un tweet en frases
individuales. Posteriormente, se acortan y ejecutar una
parte del discurso de marcado (POS) para cada
oración.
método basado en el léxico 3.3Augmented

En esta sección, se propone un enfoque basado en
el léxico aumentada para el análisis de opiniones
teniendo en cuenta las características de los datos
de Twitter.
(ii) oración imperativa: se da una orden o re- de Twitter, por ejemplo, \ #fail "y \ #sucks". Añadimos
búsqueda, por ejemplo, \ no comprar XYZ manualmente dichos fre-cuentemente utilizados
teléfono ". hashtags de opinión en nuestra opinión Lexi
acondicionado. Tenga en cuenta que también hay
(iii) frase interrogativa: se hace una pregunta, por muchas palabras cuyo PO-ridades dependerá de los
ejemplo, \ ¿cuál es el mejor escritorio HP en el
contextos en los que aparecen. Por ejemplo, \
mercado "?
inesperada" es una palabra opinión positiva
Los primeros dos tipos de frases a menudo
expresan Opin-iones. El tercer tipo, que se utiliza con
frecuencia en Twit-ter, a menudo no expresa ninguna
opinión informativo sobre las entidades. Por lo tanto,
tenemos que identificar y eliminar estas frases antes
del análisis. Adoptamos las siguientes reglas pat-tern
coincidentes para detectar la interrogativa sen-tencia
en tweets. Los patrones son los siguientes:
\ Modelo de palabra + auxiliar verbo +. . . "

\. . . + Signo de interrogación"
donde \ palabra modelo" se refiere a la primera

palabra de la frase. Debería pertenece a la palabra
establecer fwhat, dónde, cuándo, por qué, whog.
verbo auxiliar debe ser de larga a juego de palabra
fam, está, son, fue, fueron, de la mañana, no, hizo,
doesg. signo de interrogación debe ser la última
ficha en la frase.
Resolución 3.3.2Coreference
Utilizamos algunas reglas heurísticas (por ejemplo,
la entidad más cercana) para realizar la resolución
de la correferencia en tweets. Aunque esto puede no
funcionar bien en general, funciona muy bien para
los tweets porque los tweets son cortas y simples, y
tienen pocas frases complicadas. Por ejemplo, en
un tweet, \ He comprado este iPhone ayer. Es
increíble! "Podemos resolver que \ it" en la segunda
frase se refiere a \ iPhone "en la frase primera como
\ iPhone" es la entidad más cercana a \ ella".
3.3.3Opinion Lexicon
El enfoque basado en el léxico de las palabras
depende de opinión (o sentimiento), que son palabras
que expresan sentimientos posi-tivos o negativos.
Palabras que codifican un estado-de sirable (por
ejemplo, \ grande "y \ bueno ') tienen una polaridad
positiva, mientras que las palabras que codifican un
estado indeseable tienen una polaridad negativa (por
ejemplo, \ malo' y \ horrible"). A pesar de que la
polaridad opinión se aplica normalmente a adjec-tivos y
adverbios, hay verbo y sustantivo palabras de opinión
también. Los investigadores han recopilado conjuntos
de palabras Opin de iones y frases de adjetivos,
adverbios, verbos y sustantivos, respectivamente.
Obtuvimos nuestro léxico inicial opin-ion de los autores
de (Ding et al., 2008). A continuación, el léxico
enriquecido con hashtags de opinión de Twitter. Como
introducido antes, hashtags son un con-vención para
añadir contexto y metadatos adicionales a los
microblogs. Algunas etiquetas son etiquetas que
asignan sentimiento sentimiento orientación a los datos
para el dominio película. Nuestro léxico no contiene identificar enti-dades en una oración comparativa.
tales palabras. Sin embargo, vamos a discutir cómo Pattern (a) se refiere a comparativas regulares y
tratar con ellos en la siguiente sección. superlativos formas de com-parisón. El patrón (b) se
refiere a la forma ecuativa de comparación.
3.3.4Aggregating Opiniones para una entidad en
una oración
Utilizando el léxico opinión anterior con palabras
positivas, nega-tiva, podemos identificar la polaridad
opinión expresada por una entidad en una frase. Sin
embargo, en algunos casos, puede ser necesario
combinar varias palabras de opinión en una frase como
ambas palabras positivas y negativas pueden ex ist en
una oración. Usamos la fórmula de agregación en la
ecuación (1) a continuación (la cual está adaptada a
partir de (Ding et al. 2008)). La idea básica es la
siguiente. Dada una frase s que contiene la entidad
dada por el usuario, palabras de opinión en la
sentencia son primera ed identi haciendo coincidir con
las palabras en el léxico opinión. A continuación,
calcular una puntuación de orientación para la entidad
e. Una palabra positiva se asigna la puntuación
orientación semántica de 1, y una palabra negativa se
asigna la puntuación orientación semántica de 1. Todas
las puntuaciones se suman a continuación usando la
siguiente función de puntuación:
puntuación wi tan (1)
(e) =
w :w Lw s
yo yo2 \ yo2 dis (wyo;
mi)
donde wyoes una palabra de opinión, L es el léxico
opinión y s es la frase que contiene la entidad e, y DIS
(wyo; e) es la distancia entre la entidad de correo y la
palabra w opiniónyoen la frase s. wyo así es la
puntuación orientación semántico de la palabra wyo. El
inverso multiplicativo en la fórmula se utiliza para dar
pesos bajos a las palabras de opinión que están lejos
de la entidad e.
3.3.5Comparative Sentencias
En tweets, se utilizan con frecuencia frases
comparativas. Expresa similitud y di erences de más
de una entidad. Por ejemplo, la frase, \ iPhone es
mejor que el teléfono HTC "expresa una opinión posi-
tiva comparativa en el iPhone y la opinión negativa en
el teléfono \ HTC". Para este tipo de frases, no se
aplicará la regla de agregación. Tenemos que usar
técnicas especiales para hacer frente a este problema.
Como sabemos, la comparación se debe al hecho de
que las palabras positivas y negativas de opinión
tienen su formas comparativas y su-perlative que
indican los estados superior e inferior,
respectivamente, correspondientes. Por lo tanto, en
primer lugar detectar palabra comparativo realizado por
su correspondiente etiquetado POS. Por ejemplo, JJR
(adjetivo comparativo), RBR (verbo comparativo), JJS
(adjetivo superlativo y RBS (adverbio superlativo) son
buenos indicadores para frases de comparación.
Entonces explotamos los siguientes dos patrones para
(a) + entidades. . . + + Compword. . . + una regla conjuntamente para determinar la opinión
entidades polar-dad. Por ejemplo, si en un tweet, la gente escribe
(b) + entidades. . . + Como JJ +. . . + entidades una frase como \ La película es muy divertido y la trama
fue inesperado "A partir de este ejemplo, podemos
descubrir que \ inesperada" es positivo para \ trama", ya
compword es una palabra comparativa. Entidad es que es con- unido a la positiva opinión palabra \
el nombre de la entidad en la sentencia, que puede diversión". Con este
ser identi cado por su etiquetado POS - NN o PNN.
Sobre la base de la minería de opiniones, si la
sentencia es posi-tiva, a continuación, las entidades
antes de la palabra clave comparativa son superiores y
por lo demás son inferiores (con la negación
considerado). frases superlativas pueden ser
manejados de una manera similar. Tenga en cuenta
que ecuativa com-comparaciones no expresan
preferencias.
Reglas 3.3.6Opinion
Además de frases comparativas, algunas de lenguaje
con-estructuras también necesitan un manejo especial,
para el que se aplica un conjunto de reglas de
opiniones. Una regla de opinión es un im-plicatura con
una expresión de la izquierda y una opinión implícita a
la derecha. La expresión es conceptual, ya que
representa un concepto, que se puede expresar de
muchas maneras en una sentencia real.
reglas de negación: Una palabra o frase negación
generalmente revierte la opinión expresada en una
frase. palabras de negación incluyen \ no "\ no", etc.,
por ejemplo \ este teléfono móvil no es bueno ".
Pero cláusula reglas: Una frase que contiene \
pero "También es necesario un tratamiento especial
La opinión antes de \ pero" y después de \ pero
"suelen ser los opuestos entre sí Frases tales
como \ excepto que" \ excepción de" comportarse
sim-ilarly .
La disminución y el aumento de reglas: Este
conjunto de reglas dice que deceasing o el aumento de
las cantidades aso-ciados con algunos artículos con
opiniones pueden cambiar las orientaciones de las
opiniones. Por ejemplo, \ La droga alivia mi dolor en
gran medida "Aquí \ dolor" es una palabra opinión
negativa en el léxico opinión, y la reducción de \ dolor"
indica una deseable e ect de la droga. Tenga en cuenta
que compila una correspondiente lista de verbos para
este tipo de acciones, que incluyen \ aumento "\
deceso", \ disminuyen", etc. Las reglas básicas son las
siguientes:
Disminución Neg! Positivo

por ejemplo: \ Mi problema sin duda ha
disminuido ".
Disminución Pos! Negativo
por ejemplo: \ me cuesta una fortuna El iPad ".
3.3.7Handling Opiniones dependientes del contexto

palabras de opinión dependientes del contexto debe
ser determinado por su contexto. Se resuelve este
problema mediante el uso de la información global en
lugar de sólo la información local. Nosotros usamos
idea, podemos determinar la parte dependiente del E ij = fila totali totalj columna ; 1; 2gr (3)
contexto palabra polaridad opin-ion. Para otros, yo; a
dejamos que el sentimiento er clasificación para j m
determinar la polaridad, que discutiremos en la F +F +F +F 2f o
11 12 21 22
siguiente sección.
Cuanto mayor sea el valor de Chi cuadrado, la más
4 Extracción pertinaz Tweet dependiente w es con respecto a la pío positivo o
juego de pío nega-tiva. Nos seleccionar un indicador
Como se discutió en la introducción, el método de opinión si tiene un valor de chi-cuadrado no
basado en léxico puede causar baja de inferior a 6,63, que es en el nivel de significación de
recordatorio. En esta sección se propone una 0,01.
técnica para extraer los tweets pertinaces
adicionales. Nosotros extraemos primer
indicadores de opinión y luego determinar si un
tweet es obstinado o no comprobando si tiene
indicadores en el contexto. El indi-cador podría ser
una palabra o una ficha, que no es en el léxico
dictamen original.
Tabla 1: Tabla de contingencia para la prueba de chi-

cuadrado
Con W sin w fila total
F F F +F
conjunto 11 12 11 12
positivo
F F F +F
conjunto 21 22 21 22
negativo
F +F F +F
total de la 11 21 12 22
columna
Utilizamos la prueba de chi-cuadrado de Pearson

para identificar índica-tores. prueba de chi-cuadrado
de Pearson se ha utilizado popularmente para la
selección de características en el aprendizaje de la
máquina. Podemos aplicarlo a nuestro caso también.
La idea básica es que si es más probable que ocurra
en oraciones de opinión positiva o negativa de un
plazo, es más probable que sea un indicador de
opinión. Es decir, tenemos que averiguar el grado de
dependencia de un plazo w es con respecto a los
tweets positivos o tweets negativos. Tales ecotweets
ya se han etiquetado por el método basado en el
léxico. Nosotros primero creado una hipótesis nula de
que el indicador candidato w es independiente de los
tweets posi-tiva / negativos con respecto a sus
apariciones en los dos conjuntos. prueba de chi-
cuadrado de Pearson compara las frecuencias de w a
sus frecuencias esperadas para poner a prueba esta
hipótesis observó. La Tabla 1 muestra el contenido de
una tabla de contingencia.ij representa la frecuencia
indica-tor en los tweets positivos / negativos
establecidos, por ejemplo, f11 indica el recuento de
pío, que con-tains el indicador candidato w en el
conjunto pío positivo.
El valor de Chi cuadrado se calcula como sigue:
2 (Fij Eij) 2 (2)

(W) = i = 1; 2 j = 1;
2 E ij
donde E ij es la frecuencia esperada de fij
calculado,
5 El sentimiento de Clasi er utilización de la nal SVM er sentimiento
clasificación.
En esta sección, formamos un er clasificación
binaria como signo de polaridad-sentimiento a ed LLS: Después de indicadores de opinión son identi
recién identificado los tweets pertinaces en el cados en la sección 4, los ponemos en el léxico
apartado anterior. Utilizamos máquinas de vectores opinión general original, y corremos JFA nuevo. Este
soporte (SVM) como nuestro algoritmo de método también no utiliza el final SVM er
aprendizaje. sentimiento clasificación.
4 http://sites.google.com/site/twittersentimenthelp/api
datos 5.1Training
Los datos de entrenamiento son los tweets
etiquetados por el método basado en el léxico.
Utilizamos los tweets de opinión positiva y negativa
como ejemplos de entrenamiento.
5.2Classi cación de características

Nuestras características básicas son unigrams (con
negaciones con-sidered). También utilizamos
emoticonos y hashtag como características que son
espec cos a los datos de Twitter. Todos los tipos de
características se combinan en una sola
característica vec-tor. (Pang et al., 2002) muestra
que la presencia de características (valor binario) es
más útil que la frecuencia característica para la
clasificación er SVM. Por lo tanto, utilizamos valores
de características binarias para cada función en
lugar de la frecuencia característica. Con el fin de
evitar problemas de sesgo de formación, eliminamos
todas las palabras de opinión en los ejemplos de
entrenamiento. Strip-ping a cabo las palabras de
opinión hace que la clasificación er aprender de las
palabras de dominio-específico c, emoticones,
hashtags, etc. La clasificación er utiliza estas
características para determinar el sen-timent.
datos 5.3Test
Los datos de prueba es de tweets de opinión ed
recién identi de sec-ción 4. Con el fin de realizar el
análisis a nivel de entidad, el vector de
características de una entidad es el contexto en una
ventana de texto centrado en la entidad (el tamaño
de la ventana es 8 en nuestra caso, es decir, 4
palabras antes y 4 palabras después de la entidad).
6 Las evaluaciones empíricas

Para la evaluación, se comparan los resultados
experimentales de los siguientes métodos de
análisis de emociones:
ME:. Un método basado en el aprendizaje del
estado de la técnica utilizada por el sitio web \
Twitter sentimiento", que utiliza la máxima
entropía como el aprendizaje de al-gorithm
supervisó la API4 del sentimiento er
clasificación está disponible públicamente.
FBS: un método basado en léxico propuesto en
(Ding et al, 2008) para el análisis de sentimiento
basado en funciones.
JFA: el método basado en léxico aumentada para
los tweets descritos en la Sección 3, sin la
LMS: nuestro método propuesto que utiliza todos Entidad YO FBS JFA LLS LMS
los tech-nicas descritas en este documento. Obama 0,756 0,878 0,868 0,880 0,888
Harry Potter 0,764 0,862 0,880 0,902 0,910
Conjuntos 6.1Data Enredado 0,630 0,794 0,818 0,720 0,882
Protectores 0,628 0,642 0,692 0,764 0,810
Utilizamos cinco diversos conjuntos de datos de Packers 0,620 0,720 0,736 0,756 0,780
Twitter obtenidos de la API de Twitter mediante la Promedio 0,679 0,779 0,798 0,804 0,854
búsqueda en algunas entidades de la consulta.
Los términos de entidad y los correspondientes
recuentos pío se enumeran en la Tabla 2. Para
cada conjunto de datos, que al azar se-cionado
quinientos tuits como muestras de test y el resto
se utiliza en la formación. Sin etiquetado manual
está involucrado, excepto el equipo de prueba.
Tabla 2: conjuntos de datos de Twitter

consulta de Entity Tweet Conde Tweet Conde
(antes de (después
procesamiento procesamiento
previo) previo)
Obama 1001879 191942
Harry Potter 2216451 413001
Enredado 163569 42967
Protectores 477324 57985
Packers 1614193 266319
Medidas 6.2Evaluation
Utilizamos primera exactitud para evaluar el
rendimiento todo ca-ción clasificación de cada
método con tres clases, positivas, negativas y
neutras (30% - 70% de tweets no tienen opiniones,
es decir, neutro). Para los sentimientos positivos y
negativos en las entidades, empleamos las medidas
evalu-ación estándar de precisión, recordar y F-
score.
resultados 6.3Evaluation
Se evaluó manualmente el resultado de cada
método. Un problema al juzgar las opiniones de
los tweets es que las decisiones pueden ser
subjetiva. Así, un consenso tuvo que ser
alcanzado entre dos anotadores.
La Tabla 3 muestra la precisión para las tres
clases de pos-itive, negativos y neutros para cada
método. Podemos ver que la exactitud de nuestro
LMS método es mejor que todos los métodos de
referencia.
La tabla 4 muestra los resultados de la evaluación
de opiniones positivas y negativas en las entidades.
La precisión y la recuperación se calculan basándose
tanto en la ed correctamente identificados
sentimientos positivos y negativos en las entidades. A
partir de la tabla, podemos ver que el método
supervisado ME funciona mal. JFA supera FBS por
con-Sidering las características de datos de Twitter.
para F-
Tabla 3: Resultados Precisión

Tabla 4: Precision, Recall y F-Score Resultados
YO FBS JFA LLS LMS
consulta de Precisión Recordar F- Precisión Recordar F- Precisión Recordar F- Precisión Recordar F- Precisión Recordar F-
Entity Resultado Resultado Resultado Resultado Resultado
Obama 0,170 0,202 0,184 0,564 0,556 0,560 0,522 0,582 0,569 0,569 0,708 0,631 0,595 0,708 0,647
Harry Potter 0,456 0,418 0,436 0,822 0,631 0,714 0,864 0,641 0,736 0,715 0,860 0,781 0,751 0,902 0,820
Enredado 0,454 0,510 0,481 0,927 0,627 0,732 0,884 0,679 0,768 0,636 0,851 0,728 0,827 0,928 0,874
Protectores 0,263 0,294 0,278 0,360 0,352 0,356 0,436 0,356 0,392 0,576 0,802 0,671 0,636 0,831 0,721
Packers 0,247 0,327 0,282 0,550 0,445 0,492 0,672 0,484 0,563 0,551 0,714 0,622 0,629 0,753 0,686
Promedio 0,318 0,350 0,332 0,644 0,522 0,570 0,675 0,548 0,605 0,609 0,787 0,686 0,687 0,827 0,749
7. Kim, S y Hovy, E. Determinar el sentimiento de
puntuación, nuestro método LMS supera JFA por un Opiniones. COLING'04 de 2004.
amplio margen. La razón es que muchos tuits son
pertinaces ed cación y clasi correctamente por LMS. 8. Pan, S, J., Ni, X., Sun, J., Yang, Qiang., Y
LMS también realizan signi cativamente mejor que LLS Chen, Z. 2010. El sentimiento entre dominios
debido a que el método para la identificación de los Classi-catión vía espectral de alineación
indicadores de sentimiento puede conseguir muchas Feature. WWW 2010.
orientaciones sentimiento equivocado, lo que provoca
errores en la etapa posterior de la confianza de 9. Pang B y Lee L, Opinión minería y análisis de
cationes iden-ti utilizando el método basado en el los sentimientos. Fundamentos y Tendencias en
léxico de LLS. En resumen, se puede concluir que el el IR. 2008. 1-135.
método LMS propuesta supera a todos los métodos de
10. Parque, A. y Paroubek, P. 2010. Twitter como
referencia por los grandes márgenes en la un corpus de Análisis y Opinión sentimiento
identificación de las opiniones sobre las entidades. Min-ción. LCI 2010.
7 conclusiones 11. Tan, S., Wang, Y. y Cheng, X. 2008. Peine-ción
Aprender y basado en técnicas basadas en el
Las características únicas de datos de Twitter plantean
Léxico de detección de emociones y sin el uso
nuevos problemas para los enfoques basados en el
de ejemplos etiquetados. SIGIR 2008.
léxico y análisis de emociones basadas en el
aprendizaje actuales. En este trabajo, se pro-planteado 12. Taboada, M., Brooke, J., Para Loski, M., Voll,
un nuevo método para hacer frente a los problemas. K., y Stede, M. 2010. Métodos basados en
Una basada en léxico método específico aumentada c Léxico para el Análisis de sentimiento. Diario de
a los datos Twit-ter se aplicó en primer lugar para llevar Lingüistas Computacionales 2010.
a cabo el sentimiento Analy-sis. A través de la prueba
de Chi-cuadrado en su salida, los tweets pertinaces 13. Wiebe, J. y Rilo, E. 2005. La creación de res
adicionales podrían ser identi cado. Un sentimiento er Sentencia Clasi subjetivos y objetivos de Textos
clasificación binaria es entonces capacitado para tated-Unanno. Cicling 2005.
asignar polaridades sentimiento a los tweets pertinaces
ed recién identi, cuyos datos de entrenamiento es
proporcionado por el método basado en el léxico.
experimentos empíricos muestran el método propuesto
es muy e caz y prometedor.
referencias
1. Aue, A. y Gamon, M. 2005. Personalización de
Sen-timent Clasi ERS a nuevos dominios: un
estudio de caso. RANLP 2005.
2. Barbosa, L. y Feng, J. 2010. La detección
robusta Senti-ment en Twitter desde sesgada y
ruidoso de datos. COLING 2010.
3. Blitzer, J., Dredze, M., y Pereira, F. 2007 Bi-
ographies, Bollywood, Boom-cajas y
mezcladores: Adaptación de dominio para el
sentimiento Classi de cationes. ACL 2007.
4. Davidov, D., Tsur, O., Y Rappoport, A. 2010. El
sentimiento mejorado de aprendizaje utilizando
Twit-ter Hashtags y emoticonos. COLING 2010.
5. Ding, X., Liu, B., y Yu, P. 2008. Un Holis-tic-
based Approach Lexicon a la opinión de
Minería. WSDM 2008.
6. Hu, H y Liu, B. Minas y comentarios que
resumen cus-Tomer. KDD'04 de 2004.

HPL-2011-89 en Es

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

HPL-2011-89 en Es

Cargado por

Copyright:

Formatos disponibles

Combinación de métodos basados en Léxico y basado en el

aprendizaje para el Análisis Twitter sentimiento

Aprobado para publicación externa

Figura 1: Descripción de la arquitectura

El aprendizaje supervisado es el enfoque dominante.

2. \ #" Llamó el hashtag se utiliza para marcar,

3. \ @ Usuario1" representa que un mensaje es una

4. Emoticonos y expresiones coloquiales son fre-

5. Los enlaces web externos (por ejemplo

6. Longitud: Tweets están limitados a 140 caracteres.

Otra característica única de datos de Twitter com-

método basado en el léxico 3.3Augmented

\ Modelo de palabra + auxiliar verbo +. . . "

donde \ palabra modelo" se refiere a la primera

Disminución Neg! Positivo

3.3.7Handling Opiniones dependientes del contexto

Tabla 1: Tabla de contingencia para la prueba de chi-

Utilizamos la prueba de chi-cuadrado de Pearson

2 (Fij Eij) 2 (2)

5.2Classi cación de características

6 Las evaluaciones empíricas

Tabla 2: conjuntos de datos de Twitter

Tabla 3: Resultados Precisión

También podría gustarte