Está en la página 1de 8

Text Mining

“Data Science in action”


Librería twitteR

Librerías: twitteR

Es una librería de R que permite conectarse a la API de Twitter.

Que se puede hacer:

• Descargar Tweets
• Actualizar Status
• Reenviar Tweets
• Identificar las Tendencias
• Etc.

2
Principales Funciones

Autenticación setup_twitter_oauth()

Buscar Tweets searchTwitter()

Información de Usuario getUser()

Convertir a Data Frame twListToDf()

Ubicar Tendencias getTrend s() / closestTrendLocations()

Documentación https://dev.twitter.com/overview/documentation

3
Para iniciar

1. Crear una Aplicación de Twitter


https: //twitter.com/apps/new

2. Autenticación
# Definir: “API key", "API secret", "Access token", "Access secret“
Library(twitteR)
setup_twitter_oauth("API key", "API secret", "Access token", "Access secret")

3. Buscar Tweets
tw <- search(“bcpcomunica”,n=500)
df <- twListToDF(tw)
v<-VectorSource(df$text)
C<-VCorpus(v)

4. Transformar

C<- tm_map(C, removeWords,stopwords("spanish"))


C<- tm_map(C, content_transformer(tolower))
C<- tm_map(C, removeNumbers)
C<- tm_map(C, removePunctuation)

4
Para iniciar

5. Convertir a matriz de datos


tdm <- TermDocumentMatrix(C)

m<- t(data.matrix(tdm))

Vconteo <- colSums(m)


v <- sort(Vconteo,decreasing = TRUE)
dfn <- data.frame(nombre= names(v), v)
wordcloud(dfn$nombre, dfn$v, min.freq = 5)

5
Caso de Clasificación de Titulares
Deportes Economía

Espectáculos Local

6
Consultas

Realiza una Consulta

7
Contacto

@jonnychambi

facebook/jonny.chambi

linkedin.com/in/jonnychambi

jchambi@dataminingperu.com

También podría gustarte