Cómo usar el aprendizaje automático

En breve puedo mencionar dónde / con qué debería comenzar. En primer lugar, debería recomendarle que use Python para la mayoría de sus tareas. Es más fácil y también te ayuda a mejorar tu habilidad de programación. Asi que:

  1. Recopila tus datos usando una API de Twitter Python. (Solo busca en Google y elige uno)
  2. Almacene sus tweets recopilados en CSV o más avanzado, archivo JSON.
  3. Use NLTK para extraer algunas características del texto de tweets. No he usado NLTK pero supongo que debería ser posible definir un grupo de reglas y pedirle a NLTK que las busque.
  4. Asigne una base de valor uno al número de palabras en el texto y cree otro nuevo archivo de entrada con la identificación del tweet y su valor.
  5. Use scikit-learn para encontrar clústeres en su conjunto de datos.
  6. Finalmente, puede extraer algunas estadísticas y analizar los resultados.

Hola, muchas gracias, almaceno mis datos en la base de datos Neo4j y no entendí los últimos 3 pasos que me recomiendan 🙂 gracias Amir Masoud 🙂