¿Cómo manejan los investigadores de redes neuronales los largos tiempos de entrenamiento? ¿Qué haces mientras esperas?

Como saben, el problema clave de las redes neuronales es el tamaño del conjunto de datos de entrenamiento. Los investigadores dedican mucho tiempo a preparar la fecha establecida. Pero incluso cuando los datos están listos y se genera el modelo, no es el final del trabajo. El investigador necesita validar el modelo, escribir publicaciones. Por supuesto, este proceso es iterativo. Hoy en día puedes acelerar tu entrenamiento modelo usando Cloud y GPU / FPA. Pero incluso esto no cambia significativamente el tiempo de espera. Ilya Sutskever está investigando cómo minimizar los datos de entrenamiento.

Una vez que inicie el trabajo de larga ejecución de vez en cuando, lo verificará.

No hay garantías de que todo tendrá éxito. Comienza a hacer la siguiente investigación, prepara la siguiente fase de aprendizaje, valida el modelo anterior. La investigación es un estilo de vida. Puede navegar por cualquier investigador en la web y verá que él / ella tendrá muchas publicaciones.

Además, no olvide relajarse después de un duro día de trabajo.

Además del entrenamiento de la red neuronal, la generación de muestras parte del trabajo de mi doctorado fue crear una respuesta dinámica de una estructura compuesta dañada, cuya medición de respuestas y excitaciones se realizó a través de algunos sensores y actuadores inteligentes. Por lo tanto, la creación de conjuntos de datos de entrenamiento era mi primera prioridad que el entrenamiento de redes neuronales.

Hablando con franqueza durante mi doctorado, era adicto a ver la convergencia de mi red neuronal artificial con varias características diseñadas a mano, como ubicaciones de selección, valores de selección o PCA no lineal simple de un historial de respuestas, como sucedió en la era del aprendizaje preprofundo.

  1. Mire el resultado periódicamente y verifique si el entrenamiento está progresando bien
  2. Leer artículos y novedades.
  3. Busque soluciones para mejorar los resultados.
  4. Leer por placer. 🙂
  5. Tener reuniones y sesiones de lluvia de ideas.

Espero que esto ayude

Leer los documentos en su mayoría. También, ya sabes, proceder con la vida como lo hacen otras personas normales.

  1. Observe el resultado de la capacitación para ver si está funcionando o si debe detenerse antes de tiempo.
  2. Leer documentos
  3. Tener conversaciones con asesores / otros investigadores.
  4. Pensar

More Interesting

¿Hay algún aspecto conocido sobre el cerebro humano que la IA (en teoría) nunca pueda imitar?

¿La IA se volverá más inteligente que los humanos y eventualmente invadirá todo?

¿Qué tan bueno debe ser un programador para codificar la inteligencia artificial?

¿Cuál es la relación entre las redes neuronales y la regresión logística dado que un NN de alimentación de una sola capa parece una regresión logística?

Si el software fuera tan inteligente como nosotros, ¿en qué entorno funcionaría?

¿Hay alguna evidencia de que un porcentaje de la población en la simulación de la Tierra no sea real y qué porcentaje podría reemplazarse mientras se mantiene la ilusión?

¿En qué escenario futuro, si lo hubiera, la IA estaría completamente en un robot en lugar de en una red?

¿Cuánto debo asignar para Ubuntu root, swap y home para computadora Machine / Deep Learning?

Todavía estoy decidiendo mi carrera y considerando seriamente la tecnología CCNA. ¿Un robot se hará cargo de mi trabajo pronto?

¿Cómo se les ocurre a las personas una topología apropiada para las redes neuronales (recurrentes)? Me gustaría conocer las diversas heurísticas que usan los investigadores, y tal vez algunos comentarios sobre qué tan bien funcionan y cuándo podrían fallar.

¿Es la vida biológica solo un paso evolutivo entre la materia inanimada y la IA?

Cómo diseñar la personalidad de un chatbot

¿Cuándo reemplazará la inteligencia artificial a los teléfonos inteligentes?

¿Dónde puedo aprender sobre la inteligencia artificial y cómo aplicarla, y cómo puedo entenderla mejor?

¿Dónde se encuentran la inteligencia artificial y el Big Data desde el punto de vista del Big Data?