Visualización de datos: ¿Qué paquete de código abierto puedo usar para crear una nube de temas (como The Economist)?

Creé este wordcloud basado en los tweets relacionados con el retiro del Capitán del Equipo de Cricket Indio de los partidos de prueba usando R. Adjunto los códigos para que pueda usarlo si desea hacer un análisis similar.

Los códigos utilizados para esta parte específica fueron:

clean_text = clean.text(tweets.text) tweet_corpus = Corpus(VectorSource(clean_text)) tdm = TermDocumentMatrix(tweet_corpus, control = list(removePunctuation = TRUE,stopwords = c("rt", "http", stopwords("english")), removeNumbers = TRUE, tolower = TRUE)) m = as.matrix(tdm) #we define tdm as matrix word_freqs = sort(rowSums(m), decreasing=TRUE) dm = data.frame(word=names(word_freqs), freq=word_freqs) wordcloud(dm$word, dm$freq, scale=c(6,1),random.order=FALSE, colors=brewer.pal(8, "Dark2"))

Puedes ver mi publicación para ver en detalle lo que hice:
La despedida de Dhoni en Twitter

¿Está garantizado el entusiasmo por la ciencia de datos? Si es así, ¿por qué?

¿Qué son las certificaciones de Big Data? ¿Es necesario tener una buena carrera en el dominio de big data?

¿Cuál es la progresión profesional típica de un científico de datos, gerente financiero o gerente de programa?

¿Cómo se puede usar la ciencia de datos en la aviación?

¿Cuáles son algunos ejemplos del mundo real de análisis predictivo?

¿Qué tan imparcial puede ser la selección del jurado Apple v. Samsung?

R es el mejor paquete para ese tipo de cosas. Pero hay una herramienta que uso que también puede ayudar. Se llama Qiqqa – Gerente de referencia gratuito y gerente de investigación
Fantástica herramienta de investigación.

Jagadeesh Rajarajan

el paquete wordcloud en R. solo dos líneas de código. hace una nube de palabras como wordle.
para hacer un modelo de tema, básicamente nubes agrupadas, puede usar los paquetes tm y topic model / lda en R.
para hacer la animación, puedes usar el paquete de animación en R.
Para hacer una página interactiva, puede consultar uno de los paquetes en R para servir Java (pero no estoy seguro)
o puedes probarlo en Clojure. Python
¡Pero R hará el trabajo más fácil y rápido!

Jagadeesh Rajarajan

More Interesting

¿Debo usar big data como tema de investigación para mi tesis? ¿Cuál es la diferencia entre cloud computing y big data?

¿Hay personas trabajando en big data en salud en India?

¿Cuál es un ejemplo de cómo usaste la ciencia de datos para resolver un problema, tomar una decisión u optimizar algo en tu vida personal?

¿Qué pasos específicos debo seguir al trabajar en un conjunto de datos?

¿Cuál es el alcance de la actualización de Big Data en India?

¿A qué coaching / instituto debo unirme para un curso de aprendizaje de big data?

¿En qué se diferencia el algoritmo vecino k-más cercano de la agrupación k-means?

¿Qué estadísticas debo saber para hacer ciencia de datos?

¿Cómo uso el aprendizaje automático para datos espaciales?

¿Es aconsejable doble especialización en matemáticas y ciencia de datos si quiero investigar en inteligencia artificial y neurociencia?