Comienza con una arquitectura de red neuronal que ya ha sido entrenada en un gran conjunto de datos. Ejemplos bastante estándar son la referencia CaffeNet (BVLC / caffe), o la arquitectura VGG más complicada (modelo ILSVRC-2014 (equipo VGG) con 19 capas de peso).
Estos ya se han entrenado en el conjunto de datos de ImageNet, que es un conjunto de datos de clasificación de objetos grandes. Dependiendo del conjunto de datos que desee ajustar, puede elegir un modelo que haya sido entrenado previamente en un conjunto de datos diferente. Por ejemplo, si su producto final es un modelo que puede predecir una escena (a diferencia de un objeto ) a partir de un conjunto de datos de fotografía turística, puede comenzar con un modelo capacitado en el conjunto de datos MIT Places (BVLC / caffe).
En Caffe, los conjuntos de parámetros guardados (pre-entrenados) están disponibles en archivos .caffemodel, y las arquitecturas se especifican en archivos .prototxt. El enfoque general es copiar el archivo .prototxt y preservar los nombres de las capas, excepto las capas que desea reiniciar desde cero. Por lo general, esta es solo la última capa (softmax). Además, generalmente establece en cero (congelar) la velocidad de aprendizaje de las capas anteriores. Luego cambie la fuente de datos del modelo a su nuevo conjunto de datos y comience a entrenar nuevamente, asegurándose de decirle a Caffe que use el .caffemodel pre-entrenado. Cuando intente copiar los parámetros de .caffemodel, si Caffe no encuentra un nombre de capa coincidente, reiniciará la capa (por lo general, solo la última capa).
- ¿Qué áreas de las matemáticas puras son relevantes para la IA?
- ¿Cuál es el propósito de tener androides (robots humanos) en el mundo?
- ¿Hay algún podcast sobre el aprendizaje automático?
- ¿Qué tan cierta es la cita, "el desarrollo de una IA que podría terminar con la vida humana puede requerir solo unos cientos de personas en un edificio de oficinas en cualquier parte del mundo, sin otro equipo que no sea una computadora portátil"?
- ¿Por qué el aprendizaje profundo funciona tan bien en el mundo real?
Por supuesto, es posible que desee ajustar su modelo pre-entrenado. Hay varios botones que puede sintonizar:
1) La tasa de aprendizaje (generalmente menor en un factor de 10)
2) El número de capas que afinas. Si tiene suficientes datos, para las capas anteriores, en lugar de establecer sus tasas de aprendizaje en 0, puede optar por establecer sus tasas de aprendizaje en un número pequeño.