¿Qué tipo de algoritmo de procesamiento del lenguaje natural se usaría para replicar los resultados de esta charla TED?

Es probable que necesite 3 piezas diferentes de tecnología para replicar estos resultados. Con respecto al procesamiento del lenguaje natural, puede usar un servicio basado en la nube como Semantria (aquí hay un enlace: Análisis de texto y Análisis de opinión para todos) que le permitirá ejecutar 10k documentos de forma gratuita.

Para adquirir los datos, puede utilizar un proveedor de datos sociales como GNIP (aquí hay un enlace: La fuente de los datos sociales). También hay una herramienta gratuita que todavía está en versión beta (pero funciona muy bien) llamada import-io (aquí hay un enlace: Desguace de datos web estructurado). Si su conjunto de datos es pequeño, también puede simplemente copiar y pegar, pero para un ejemplo como el de este video TED, necesitaría un conjunto de datos grande para producir resultados similares.

Finalmente, necesitaría algún tipo de herramienta de visualización de datos para crear una buena nube de palabras en 3D como esa. Los chicos del Nerdery son excelentes, pero caros. Puede construir uno usted mismo de forma gratuita usando Wordle (aquí hay un enlace: Wordle – Beautiful Word Clouds) pero no será tan avanzado como el del video.

Espero que todo esto tenga sentido. Si usa Semantria, import-io y wordle, puede crear algo muy similar a lo que hicieron en este video TED de forma gratuita.

More Interesting

¿Qué libro debo comprar para aprender sobre algoritmos: estructuras de datos y algoritmos simplificados por Narsimha Karumanchi o Introducción a los algoritmos (CLRS)?

¿Cuáles son las ventajas de usar la notación (0,1) en el sistema binario?

¿Cuál es la diferencia entre la implementación vinculada y la implementación contigua en listas?

¿Le da un algoritmo no recursivo que realiza un trabajo de árbol de orden?

¿Cómo funciona el algoritmo what3words?

Cuando se utilizan códigos de corrección de errores (ECC), ¿cómo detecta el algoritmo si los bits de ECC están dañados?

¿Qué estructura de datos debo usar si estoy diseñando un algoritmo que clasifica las páginas por relevancia de acuerdo con la cantidad de veces que se ven?

¿Cuáles son algunos algoritmos o sistemas de mejora automática?

¿Cuál es el mejor algoritmo de aprendizaje profundo sin supervisión para aprender características de los datos de secuencia biológica?

¿Cómo se comunican los dispositivos GPS con los servidores?

En robótica, ¿cuáles son algunos algoritmos de planificación de rutas fáciles de implementar en un Turtlebot en ROS?

Normalmente me canso después de resolver 2 - 3 problemas algorítmicos en Leet Code. ¿Qué debo hacer para resolver más problemas diariamente?

¿Cómo podrían analizarse las preguntas arbitrarias de Quora para adivinar si el cartel es suicida?

¿Cuál es la complejidad del algoritmo criptográfico RSA?

¿Hay algún libro que tenga todos los códigos para todas las estructuras de datos? ¿Al menos para todas las estructuras de datos de árbol?