En general si.
Existen muchas técnicas que permiten modelos de entrenamiento en las entradas donde el número de características es mucho mayor que el número de ejemplos de entrenamiento.
En general, siempre que crea que su separación entre el tren y la prueba durante el proceso de validación cruzada asegura que no haya “fugas” de entropía del tren a la prueba, y siempre que los resultados de la validación cruzada sean positivos, el modelo es confiable.
- ¿Cuál sería el mejor desafío de Kaggle para mí como entusiasta del aprendizaje automático de nivel intermedio?
- ¿Pueden las redes neuronales profundas resolver problemas NP-Hard?
- ¿Cuál es el peor caso de sobreajuste que hayas visto en entornos sociales o psicológicos?
- Cómo construir y trazar una gráfica de vecinos más cercanos
- ¿Son las redes neuronales artificiales la única forma de establecer un aprendizaje profundo?
Si aún no confía en él, ejecute una prueba de regresión “justa”: entrene los datos obtenidos antes de alguna marca de tiempo (quizás “hasta ahora”) y pruébelo en los datos que llegaron después (quizás “la próxima semana”) . Siempre y cuando el modelo funcione bien (importante: en la cola larga, en los tipos de entradas que no ha visto antes también, no solo en la “cabeza pesada” donde no es realmente una prueba de que el modelo generalice), eres bueno para ir.