¿Cuál es el flujo de trabajo típico para resolver un problema? ¿En general?
El primer paso es asegurarse de que comprende el problema. De todos los problemas, muy pocos se resuelven mediante el aprendizaje profundo mejor que con otros métodos menos costosos. Sería una pena desperdiciar una tonelada de recursos y mano de obra calificada.
Es imposible responder las preguntas “cómo preprocesar datos” o “cómo obtener las etiquetas cuando no tiene etiquetas” porque cada conjunto de datos es único. Lo que se pretende es almacenar el conjunto de entrenamiento en un formato compatible con su canalización (por ejemplo, si usa Torch, convierta todo de antemano en formato de tensor Torch). Si está escribiendo un modelo altamente personalizado, escriba verificaciones de gradiente, de lo contrario no sabrá por qué su función de pérdida se dispara.
- ¿Puedo tomar el curso de aprendizaje automático de Andrew Ng siendo un estudiante de secundaria con algo de experiencia en programación y sin conocimientos avanzados de matemáticas?
- ¿Cuál ha sido la experiencia de la gente con RapidMiner?
- ¿El aprendizaje automático es un comienzo de invasión de estadísticas?
- ¿Podría la IA volverse autónoma y aprender y adaptarse de manera no supervisada a través del aprendizaje profundo?
- ¿Qué empresas o agencias utilizan (d) Vader para el análisis de sentimientos?
Por lo general, los investigadores comienzan con la construcción de una línea base, un método ya conocido y descrito, para hacerse una idea de lo que puede obtener con las soluciones existentes. Un comienzo perfecto es un modelo previamente entrenado, ImageNet listo para usar, por ejemplo. El ciclo de experimento corto es crítico, de lo contrario, pasa mucho tiempo preguntándose si todo falla o no. La mayoría de las veces lo hace.
Considere el tiempo de entrenamiento. Configure rutinas de monitorización y serialización intermedia, de modo que pueda pausar el proceso y mirar dentro. La capacitación en todo el conjunto de datos desde el principio es una mala idea, ya que ralentiza la depuración y las comprobaciones de cordura que necesita ejecutar incluso antes de comenzar el proceso. Cuando preentrenas un modelo enorme y silenciosamente no puedes cargarlo durante la evaluación, obteniendo resultados aleatorios, es vergonzoso.
Lea los documentos que describen soluciones para las tareas similares a las suyas. No solo los autores describen sus flujos de trabajo, sino que también dan razones para sus elecciones. Se ahorra mucho tiempo.