¿Qué harás cuando entrenes a tu modelo?

Cuando estoy listo para entrenar a un modelo, me preparo para la fase de prueba. Entonces, cuando comienza el entrenamiento, normalmente empiezo a configurar experimentos para que una vez que se complete el entrenamiento modelo pueda probarlo en tareas cada vez más desafiantes para poder evaluar su efectividad. Sí, es posible dejar que el sistema se pruebe a sí mismo en los datos de prueba, pero tengo que decidir sistemáticamente en qué otras tareas debería probarlo dependiendo de su área de aplicación potencial.

A veces, si termino de preparar los experimentos antes de que se complete el entrenamiento del modelo, entonces me relajo mientras espero que el modelo termine el entrenamiento. Me relajo jugando videojuegos, Quora y TV. He descubierto que Facebook parece aumentar los niveles de estrés un poco innecesariamente, por lo que paso menos tiempo allí en estos días. En cambio, paso ese tiempo con la familia (todavía no tengo hijos).

Después de terminar la capacitación, comienzo los experimentos hasta que decido si el rendimiento del sistema es lo que quiero o no. Normalmente establezco un estándar. Para un sistema de visión, debe tener una precisión del 95% en MNIST antes de que pueda pasar a tareas más desafiantes.

También me gusta jugar con funciones de activación y arquitecturas extrañas, así que me muevo en círculos de diseño, implementación, capacitación y pruebas antes de encontrar la arquitectura que funciona.

Espero que esto ayude.

Normalmente sigo trabajando XD. Cuando tienes que entrenar algo como esto, es una buena práctica tener una computadora para entrenar y otra para seguir trabajando. Entonces … hago el mismo entrenamiento o no

En realidad, el entrenamiento de las redes de comunicación requiere menos tiempo en estos días: entreno a Alexnet en 30 minutos con DGX1-v. Resnet-50 todavía tarda ~ 6 horas usando 1 caja. . Si usa grupos de servidores GPU, puede hacerlo por debajo de 1 hora.

Preguntar y responder preguntas sobre Quora

Miro el monitor todo el tiempo, ansioso por obtener los resultados para la próxima época. Después de un tiempo empiezo a tener sentimientos contrastantes:

  1. una parte de mí espera que la pérdida disminuya;
  2. la otra parte espera lo contrario, para que parar temprano haga su trabajo y pueda volver a mis cosas.

More Interesting

¿Se puede desarrollar un bot de chat usando Tensorflow? En caso afirmativo, ¿cómo empiezo a codificar en el mismo?

Si una red de alimentación directa de una sola capa es capaz de aproximarse a cualquier grado de precisión, ¿por qué es exitoso el aprendizaje profundo?

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

Hablando intuitivamente, ¿cuál es la diferencia entre la estimación bayesiana y la estimación de máxima verosimilitud?

¿Qué es la curva de recuperación de precisión (PR)?

¿Pueden los algoritmos de aprendizaje profundo predecir los resultados de los partidos deportivos?

Cómo manejar una imagen de diferentes tamaños en una red convolucional de MatConvNet con un contenedor DagNN

¿Cuál es el editor preferido para un tipo de aprendizaje automático que trabaja principalmente en Python?

¿Cuál es mejor para la manipulación de datos en python: Pandas o SFrame?

¿Qué significa que las funciones de activación (como ReLU) en NN inducen la escasez en las unidades ocultas?

¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?

¿Cuáles son los mejores recursos disponibles en línea para aprender a pensar en diseño?

La minería de datos es una versión más fuerte de ajuste de curvas, ¿es correcta?

¿Dónde debo comenzar si quiero escribir un algoritmo de etiquetado y clasificación de oraciones?

¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?