Es probable que necesite 3 piezas diferentes de tecnología para replicar estos resultados. Con respecto al procesamiento del lenguaje natural, puede usar un servicio basado en la nube como Semantria (aquí hay un enlace: Análisis de texto y Análisis de opinión para todos) que le permitirá ejecutar 10k documentos de forma gratuita.
Para adquirir los datos, puede utilizar un proveedor de datos sociales como GNIP (aquí hay un enlace: La fuente de los datos sociales). También hay una herramienta gratuita que todavía está en versión beta (pero funciona muy bien) llamada import-io (aquí hay un enlace: Desguace de datos web estructurado). Si su conjunto de datos es pequeño, también puede simplemente copiar y pegar, pero para un ejemplo como el de este video TED, necesitaría un conjunto de datos grande para producir resultados similares.
Finalmente, necesitaría algún tipo de herramienta de visualización de datos para crear una buena nube de palabras en 3D como esa. Los chicos del Nerdery son excelentes, pero caros. Puede construir uno usted mismo de forma gratuita usando Wordle (aquí hay un enlace: Wordle – Beautiful Word Clouds) pero no será tan avanzado como el del video.
- ¿Cuándo debería mirar la solución de algún problema algorítmico?
- ¿Cuál es el orden de lectura de estructuras de datos y algoritmos para un aprendizaje fluido?
- ¿Qué algoritmo debo usar para codificar un solucionador de Sudoku usando la teoría de grafos?
- ¿Qué es el recorrido NAT y por qué debería usarlo?
- Cómo diseñar una estructura de datos que pueda almacenar 1-1000 números
Espero que todo esto tenga sentido. Si usa Semantria, import-io y wordle, puede crear algo muy similar a lo que hicieron en este video TED de forma gratuita.