¿Qué harás cuando entrenes a tu modelo?

Cuando estoy listo para entrenar a un modelo, me preparo para la fase de prueba. Entonces, cuando comienza el entrenamiento, normalmente empiezo a configurar experimentos para que una vez que se complete el entrenamiento modelo pueda probarlo en tareas cada vez más desafiantes para poder evaluar su efectividad. Sí, es posible dejar que el sistema se pruebe a sí mismo en los datos de prueba, pero tengo que decidir sistemáticamente en qué otras tareas debería probarlo dependiendo de su área de aplicación potencial.

A veces, si termino de preparar los experimentos antes de que se complete el entrenamiento del modelo, entonces me relajo mientras espero que el modelo termine el entrenamiento. Me relajo jugando videojuegos, Quora y TV. He descubierto que Facebook parece aumentar los niveles de estrés un poco innecesariamente, por lo que paso menos tiempo allí en estos días. En cambio, paso ese tiempo con la familia (todavía no tengo hijos).

Después de terminar la capacitación, comienzo los experimentos hasta que decido si el rendimiento del sistema es lo que quiero o no. Normalmente establezco un estándar. Para un sistema de visión, debe tener una precisión del 95% en MNIST antes de que pueda pasar a tareas más desafiantes.

También me gusta jugar con funciones de activación y arquitecturas extrañas, así que me muevo en círculos de diseño, implementación, capacitación y pruebas antes de encontrar la arquitectura que funciona.

Espero que esto ayude.

Deep LearningMachine Learning

Related Content

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.

¿Se puede usar una máquina de Boltzmann profunda para la clasificación de imágenes en una base de datos que tiene solo mil imágenes y tiene características de imagen de valor real como unidades de entrada (en lugar de unidades de píxeles binarios)?

El lenguaje de máquina se ha mencionado en todas partes. ¿Qué es en realidad?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2013?

Tengo una entrevista telefónica técnica para una pasantía la próxima semana con el aprendizaje automático y el equipo de fraude de Uber. ¿Debo esperar DS y algoritmos generales o algo más?

Cómo encontrar el siguiente número de la lista de números anteriores usando el aprendizaje profundo

¿Cuál puede ser el papel de la IA en las operaciones de seguridad?

Normalmente sigo trabajando XD. Cuando tienes que entrenar algo como esto, es una buena práctica tener una computadora para entrenar y otra para seguir trabajando. Entonces … hago el mismo entrenamiento o no

Alexander Yau

En realidad, el entrenamiento de las redes de comunicación requiere menos tiempo en estos días: entreno a Alexnet en 30 minutos con DGX1-v. Resnet-50 todavía tarda ~ 6 horas usando 1 caja. . Si usa grupos de servidores GPU, puede hacerlo por debajo de 1 hora.

Alexander Yau

Preguntar y responder preguntas sobre Quora

Alexander Yau

Miro el monitor todo el tiempo, ansioso por obtener los resultados para la próxima época. Después de un tiempo empiezo a tener sentimientos contrastantes:

una parte de mí espera que la pérdida disminuya;
la otra parte espera lo contrario, para que parar temprano haga su trabajo y pueda volver a mis cosas.

Alexander Yau

More Interesting

¿Se puede desarrollar un bot de chat usando Tensorflow? En caso afirmativo, ¿cómo empiezo a codificar en el mismo?

Si una red de alimentación directa de una sola capa es capaz de aproximarse a cualquier grado de precisión, ¿por qué es exitoso el aprendizaje profundo?

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

Hablando intuitivamente, ¿cuál es la diferencia entre la estimación bayesiana y la estimación de máxima verosimilitud?

¿Qué es la curva de recuperación de precisión (PR)?

¿Pueden los algoritmos de aprendizaje profundo predecir los resultados de los partidos deportivos?

Cómo manejar una imagen de diferentes tamaños en una red convolucional de MatConvNet con un contenedor DagNN

¿Cuál es el editor preferido para un tipo de aprendizaje automático que trabaja principalmente en Python?

¿Cuál es mejor para la manipulación de datos en python: Pandas o SFrame?

¿Qué significa que las funciones de activación (como ReLU) en NN inducen la escasez en las unidades ocultas?

¿Qué es la selección de variables en bloques cuando se hace un análisis de regresión?

¿Cuáles son los mejores recursos disponibles en línea para aprender a pensar en diseño?

La minería de datos es una versión más fuerte de ajuste de curvas, ¿es correcta?

¿Dónde debo comenzar si quiero escribir un algoritmo de etiquetado y clasificación de oraciones?

¿Cuáles son los dominios en los que las técnicas de aprendizaje profundo podrían aplicarse además del procesamiento de la visión por computadora y el lenguaje / habla?

Web Analytics