Cómo evaluar mi modelo cada época en TensorFlow

Hay algunas opciones, desde hacky hasta elegantes (en mi opinión):

  • Puede usar el llamado enfoque de desempaquetado , donde para cada longitud de secuencia, tiene una réplica de su modelo. Deben compartir todos los parámetros, pero tener un número diferente de pasos recurrentes. Ahora puede entrenar / probar / hacer lo que quiera siempre que elija la réplica de modelo correcta para trabajar con la secuencia correspondiente.
  • Puede enmascarar, es decir, codifica a priori la secuencia más larga con la que está dispuesto a trabajar y crea un modelo con esa cantidad de pasos. Luego, cuando tenga secuencias más cortas para entrenar o probar, acomódelas con algunos tokens especiales y realice algunos pasos adicionales en su gráfico TF para manejarlos.
  • Puede usar las características dinámicas RNN de Tensorflow. Manejarán secuencias de longitud variable sin desperdiciar su memoria, ni lo obligarán a manejar máscaras molestas. tf.while_loop es el camino a seguir si quieres construir cosas de manera flexible desde cero. Si quieres una vida fácil incorporada, también puedes considerar probar tf.nn.dynamic_rnn .

¿Puedes construir un segundo gráfico para la prueba que reutilice las variables del entrenamiento? Creo que eso resolvería tu problema.

More Interesting

Un fundador de un fondo de cobertura me dijo que los graduados de doctorado en Big Data / ML están generando un millón de dólares al año como salario en el comercio / fondos de cobertura. ¿Qué tan correcto es esto?

¿Cómo nos beneficia exactamente el entrenamiento previo en los métodos de aprendizaje profundo?

Cómo pasar del desarrollo de pila completa al aprendizaje automático en el trabajo independiente

Como dicen, cada función posible se puede modelar con una percepción de 2 capas, en teoría, ¿se puede modelar una función del universo en una red neuronal con 2 o 3 capas de profundidad?

¿Es el número de nodos en una capa oculta más que la capa de entrada? ¿Es esto un problema? ¿Qué se puede aprender en tales redes neuronales?

¿Por qué la optimización convexa es tan importante en el aprendizaje automático?

¿El sobreajuste en un conjunto de datos implica que el modelo realmente puede aprender y generalizar sobre ese conjunto de datos, pero desafortunadamente demasiado entrenado?

¿Cómo ha sido su experiencia en Quora con Computer Vision y la comunidad relacionada?

Dado el mismo tamaño de lote, ¿hay algún beneficio en transferir la capacitación CNN de una sola GPU a múltiples GPU (para un tamaño de lote de 128 en 4 GPU, cada GPU procesará 32 muestras)?

Cómo escribir un buen artículo sobre aprendizaje profundo o reforzar el aprendizaje sin la ayuda de un supervisor profesional

Redes neuronales convolucionales: ¿Cuáles son algunos posibles proyectos de cursos de aprendizaje automático de nivel de posgrado que utilizan CNN? Específicamente en el límite de PNL y CV.

¿Qué sigue después del aprendizaje profundo?

Redes Adversarias Generativas: ¿cuál es la intuición detrás del mapeo de una muestra de ruido aleatorio a una muestra de datos?

¿Cómo se pueden utilizar los autoencoders apilados para preentrenar una red neuronal que tiene más neuronas en las capas ocultas que entradas? es posible?

¿Hay alguna empresa india que trabaje con IA y aprendizaje automático? En caso afirmativo, ¿en qué campo y en qué se diferencia de otros en ese campo?