¿Cuál es el flujo de trabajo típico para usar el aprendizaje profundo para resolver un problema?

¿Cuál es el flujo de trabajo típico para resolver un problema? ¿En general?

El primer paso es asegurarse de que comprende el problema. De todos los problemas, muy pocos se resuelven mediante el aprendizaje profundo mejor que con otros métodos menos costosos. Sería una pena desperdiciar una tonelada de recursos y mano de obra calificada.

Es imposible responder las preguntas “cómo preprocesar datos” o “cómo obtener las etiquetas cuando no tiene etiquetas” porque cada conjunto de datos es único. Lo que se pretende es almacenar el conjunto de entrenamiento en un formato compatible con su canalización (por ejemplo, si usa Torch, convierta todo de antemano en formato de tensor Torch). Si está escribiendo un modelo altamente personalizado, escriba verificaciones de gradiente, de lo contrario no sabrá por qué su función de pérdida se dispara.

Por lo general, los investigadores comienzan con la construcción de una línea base, un método ya conocido y descrito, para hacerse una idea de lo que puede obtener con las soluciones existentes. Un comienzo perfecto es un modelo previamente entrenado, ImageNet listo para usar, por ejemplo. El ciclo de experimento corto es crítico, de lo contrario, pasa mucho tiempo preguntándose si todo falla o no. La mayoría de las veces lo hace.

Considere el tiempo de entrenamiento. Configure rutinas de monitorización y serialización intermedia, de modo que pueda pausar el proceso y mirar dentro. La capacitación en todo el conjunto de datos desde el principio es una mala idea, ya que ralentiza la depuración y las comprobaciones de cordura que necesita ejecutar incluso antes de comenzar el proceso. Cuando preentrenas un modelo enorme y silenciosamente no puedes cargarlo durante la evaluación, obteniendo resultados aleatorios, es vergonzoso.

Lea los documentos que describen soluciones para las tareas similares a las suyas. No solo los autores describen sus flujos de trabajo, sino que también dan razones para sus elecciones. Se ahorra mucho tiempo.

¿Es posible crear un 'ser' inteligente (AI) no una 'máquina'?

¿Cuál es la diferencia entre Bayes ingenuo y la entropía máxima?

¿Cuáles son los inconvenientes de usar RL con funciones de aproximación en altas dimensiones? ¿Cómo aprender la función de recompensa 0-1 (regresión logística)?

¿Cuáles son ejemplos cuando es útil generar muestras a partir de un modelo probabilístico?

¿Cómo se relaciona la inteligencia artificial con la inteligencia empresarial?

¿Cuál es la mejor manera de manejar múltiples brazos en algoritmos de bandidos?

Un par de métodos vienen a la mente. Primero puede usar algo como un autoencoder para extraer características de las imágenes y luego ejecutar algún tipo de agrupación en ellas. Incluso puede usar un modelo previamente entrenado como VGGNet para obtener las funciones. En segundo lugar, puede usar un enfoque de arranque donde clasifica manualmente un pequeño conjunto de datos. Luego, en varias iteraciones, agrega más datos a su conjunto de entrenamiento utilizando un clasificador entrenado en su mini conjunto de entrenamiento.

Nikhil Badugu

More Interesting

¿Cuáles son algunas buenas escuelas de investigación (PhD) para Inteligencia Artificial General (no Machine Learning)?

¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?

¿Se pueden mapear los datos de entrada circulares (como la fase de una sinusoide) en un espacio de características lineales usando un núcleo lineal usando SVM? Si no, ¿qué núcleo es óptimo para datos de entrada circulares?

¿Estudiar el aprendizaje automático y el aprendizaje profundo al mismo tiempo tendrá una buena o mala influencia en mi sistema de conocimiento?

¿Cuáles son los mejores métodos para recopilar datos de entrenamiento para el algoritmo Naive Bayes?

¿Cuáles son las principales diferencias entre TensorFlow y SciKit Learn?

¿En qué áreas podría el aprendizaje automático ayudar a las personas a tomar decisiones imparciales?

Cómo comenzar a hacer un proyecto de aprendizaje automático

¿Por qué la inteligencia artificial se vuelve agresiva?

¿Puede la red neuronal convolucional reconocer un objeto en cualquier condición?