Esta es mi primera reacción intestinal sin preocuparme por su 100% o no. El entrenamiento excesivo puede conducir a un sobreajuste que, por definición, es que el error del tren no refleja el error de la prueba. Por lo general, lo que se hace es una técnica llamada parada temprana y que generalmente evita el sobreajuste. La regularización también se usa con frecuencia (a través de l1, l2, abandono, norma de lote, etc.).
Si su modelo tiene un 100% de entrenamiento acc, eso generalmente significa que el gradiente no cambiará el modelo ya que está en la pérdida más baja posible (ya que está optimizando el error del tren), por lo que probablemente significa que más épocas no cambiarán su modelo en de una manera significativa
Sin embargo, dado que el entrenamiento de NN es un problema no convexo si no tenía una tasa de descomposición que fuera sensata para comenzar, podría saltar a un mínimo (local) totalmente diferente (pero en este caso probablemente sea un mínimo global ya que dijo que el error es el más bajo, 0 o 100% acc). Esto podría ser bueno o podría ser malo (dependiendo de si el punto mínimo / crítico alternativo tiene un error de prueba más bajo), pero para responder a su pregunta, podría significar que más épocas realmente hacen algo.
- ¿Cuál es un buen tutorial sobre el uso de Weka con Big Data?
- ¿Qué sistemas IDS, IPS en Network Security hoy en día son los más adaptables para aprender nuevas amenazas? ¿Hay algún tipo de punto de referencia estándar para medir esto?
- ¿Qué son las redes neuronales convolucionales?
- ¿Cuál es la motivación de Google para el código abierto del modelo de TensorFlow para problemas ML / NLP como el resumen automático de texto?
- ¿Hay alguna posibilidad de una B.Tech (CS) más fresca en trabajos de aprendizaje automático (ciencia de datos) en Bangalore?
Solo trataría de comenzar para detener el entrenamiento una vez que el error de validación comience a aumentar y ver desde allí qué hacer. Intenta esto varias veces. Si sus errores de prueba y entrenamiento están muy lejos el uno del otro, generalmente es un signo de sobreajuste.