Primero, debe preguntar exactamente qué desea analizar y predecir. Esto hará una gran diferencia en las técnicas que debe utilizar.
Una vez que eso está fuera del camino, llegamos a la pregunta real. Cuando se trata de texto, a menudo representamos el texto por una serie de características:
- ¿con qué frecuencia aparecen palabras clave específicas?
- ¿Cuál es la proporción de palabras vacías a palabras sin parar?
- excluyendo las palabras de detención, ¿cuál es el vector semántico promedio (por ejemplo, word2vec u otro modelo) del mensaje?
- ¿En qué medida atribuimos la emoción “feliz” a este mensaje?
Al usar estas otras características relevantes, ahora solo nos quedan características numéricas. Cómo desea utilizarlos y qué modelo debe usar depende totalmente de la tarea y de los supuestos que cree que puede hacer de manera segura.
- ¿Cuáles son algunos conjuntos de datos sin resolver que son los objetivos de la investigación actual de Deep Learning?
- ¿Qué has aprendido haciendo investigación?
- Cómo comenzar a aprender y codificar Inteligencia Artificial
- ¿Cuál es la diferencia entre el aprendizaje automático en Python y R?
- ¿Cuál es la diferencia entre Python y el aprendizaje automático?
Cuando se trata de tipos de variables mixtas, hay otras opciones. Podría construir un sistema que combine diferentes componentes para tratar diferentes aspectos de los datos. Nuevamente, esto depende completamente de la tarea real.
¡Buena suerte!