Hiciste 2 preguntas diferentes:
- ¿Cómo trato con datos insuficientes? Además de hacer el aprendizaje de transferencia que otros mencionaron, hay un campo completo sobre este tema llamado ‘aprendizaje bajo’. Además, ‘aprendizaje débilmente supervisado’. Deberías profundizar en ambos. Personalmente, me gustaría que los demás recomienden que comiences con el aprendizaje de transferencia porque el tiro bajo es un campo más difícil. Cuando haya agotado el aprendizaje de transferencia, comenzaría con este artículo.
- ¿Cómo trato con datos ergo “no tan buenos”? Esta es una pregunta extremadamente importante que a menudo se pasa por alto en los conjuntos de datos académicos. Lo que sí recomiendo es una combinación de:
- Haga un análisis exploratorio de datos y verifique si puede encontrar algunas heurísticas que limpien sus datos.
- Hay un campo en las estadísticas llamado ‘estadísticas robustas’ que a menudo se pasa por alto en la comunidad de aprendizaje profundo a favor del uso de ‘más datos’ (que es una excelente solución cuando tienes los datos, ¡porque te hace más resistente al ruido!) . Cuando no tiene muchos datos, buscaría funciones de pérdida robustas. Y también intente usar la detección de valores atípicos en su conjunto de datos y elimine los valores atípicos en caso de que se trate de clasificación. No hay muchos documentos recientes sobre el uso de herramientas robustas en el ámbito del aprendizaje profundo, pero aquí están mis recomendaciones para empezar: me gustó su uso para la regresión. Y este para la clasificación.