Creé este wordcloud basado en los tweets relacionados con el retiro del Capitán del Equipo de Cricket Indio de los partidos de prueba usando R. Adjunto los códigos para que pueda usarlo si desea hacer un análisis similar.
Los códigos utilizados para esta parte específica fueron:
clean_text = clean.text(tweets.text) tweet_corpus = Corpus(VectorSource(clean_text)) tdm = TermDocumentMatrix(tweet_corpus, control = list(removePunctuation = TRUE,stopwords = c("rt", "http", stopwords("english")), removeNumbers = TRUE, tolower = TRUE)) m = as.matrix(tdm) #we define tdm as matrix word_freqs = sort(rowSums(m), decreasing=TRUE) dm = data.frame(word=names(word_freqs), freq=word_freqs) wordcloud(dm$word, dm$freq, scale=c(6,1),random.order=FALSE, colors=brewer.pal(8, "Dark2"))
Puedes ver mi publicación para ver en detalle lo que hice:
La despedida de Dhoni en Twitter
- ¿Qué es el análisis de datos grandes y el alcance de Hadoop?
- ¿Es la ciencia de datos un tema extremadamente aburrido?
- Cómo hacer un trabajo orientado a la investigación en big data
- ¿Cuáles son los beneficios de la construcción de datos?
- ¿Qué nivel de preguntas de codificación del algoritmo Python le pedirían para una entrevista de ciencia de datos (nivel interno)?