Soy un creyente en la práctica hace la perfección. La experiencia práctica siempre me ha ayudado, ya que un libro de texto (que tiene un gran conocimiento) no podrá ayudarlo a comprender los errores más comunes que podría cometer al usar el procesamiento del lenguaje natural.
Ejemplo: la limpieza de texto es muy relevante para el proceso de negocio y, por lo tanto, necesitaría un enfoque personalizado. El enfoque textual podría conducir a resultados generalizados o irrelevantes para los modelos.
Sugeriría comenzar con un conjunto de datos, hay muchos recursos gratuitos disponibles en línea. Para comenzar puedes mirar.
- ¿Se puede extraer información significativa de un sistema caótico utilizando una red neuronal?
- ¿Cuál es la distribución condicional completa?
- ¿Cuáles son las implicaciones epistemológicas del hecho de que no podríamos haber programado conscientemente una red neuronal para hacer lo que hace?
- ¿Qué puede ayudar a averiguar si una función de pérdida es sensible al ruido o no?
- ¿Qué tan buenas son mis posibilidades de conseguir un trabajo de científico de datos con un doctorado en el campo de la visión por computadora?
- Conjunto de datos de correo electrónico de Enron
- Kaggle.com- (busque conjuntos de datos nlp)
Definitivamente, el libro NLTK lo ayudará cuando se atasque o necesite ayuda teórica. ¡Puedes repasar los conceptos del libro y probarlo en la práctica!