En realidad, como cualquier problema de aprendizaje automático, esto tiene que ver con la ingeniería de características. Eso siempre es un trabajo duro y un poco de suerte.
Por lo general, lo que uno hace es un poco de intuición. Lo hago de esta manera: hay muchas personas con más experiencia y pueden asesorar sobre mejores formas.
- Sé ‘basado en el conocimiento del dominio si una característica particular tendría más influencia en la variable objetivo. En tal caso, agrego 2do grado para esa característica.
- Uso la regularización L1 si tengo un conjunto de características dispersas para eliminar características innecesarias y luego uso el descenso de gradiente con la regularización L2 para llegar a las variables correctas.
- En cada lugar utilizo la validación cruzada, dependiendo del volumen de datos. Prefiero K-Fold para la competencia, ya que el conjunto de datos suele ser pequeño.
- Cómo cuantificar la cantidad de ruido en un conjunto de datos
- ¿Es un SVM o un clasificador MaxEnt apropiado para este escenario de clasificación de texto y por qué?
- ¿Cómo escribe Google las pruebas para su algoritmo de búsqueda para que sepan que no lo rompieron al hacer cambios?
- ¿Existe una API para reconocimiento facial?
- Redes neuronales artificiales: ¿Qué determina si un problema de clasificación no trivial para el aprendizaje profundo se puede dividir en capas convolucionales en lugar de capas completamente conectadas?