Hola ismail
De hecho, pre-entrenado en sí mismo significa un modelo que ya ha sido entrenado en algún tipo de conjunto de datos con diferente número de clases. En el aprendizaje profundo hay un término llamado “aprendizaje de transferencia”, ¿qué significa? Bueno, este concepto dice que los modelos CNN tienen esta capacidad de aprender algún tipo de información de otros conjuntos de datos. En la práctica, muy pocas personas entrenan a toda una Red Convolucional desde cero (con inicialización aleatoria), porque es relativamente raro tener un conjunto de datos de tamaño suficiente. En cambio, es común entrenar previamente un modelo CNN en un conjunto de datos muy grande (por ejemplo, ImageNet, que contiene 1,2 millones de imágenes con 1000 categorías), y luego usar esto como inicialización o como extractor de características fijas para la tarea de interés. . El enfoque principal de Transfer Learning es
- Afinando el modelo . . Es posible ajustar todas las capas de ConvNet, o es posible mantener algunas de las capas anteriores fijas (debido a problemas de sobreajuste) y solo ajustar una parte de la red de nivel superior. Esto está motivado por la observación de que las características anteriores de una ConvNet contienen características más genéricas (p. Ej., Detectores de bordes o detectores de manchas de color) que deberían ser útiles para muchas tareas, pero las capas posteriores de la ConvNet se vuelven progresivamente más específicas a los detalles de las clases. contenido en el conjunto de datos original. En el caso de ImageNet, por ejemplo, que contiene muchas razas de perros, una parte significativa del poder de representación de ConvNet se puede dedicar a características que son específicas para diferenciar entre razas de perros.
Para obtener más detalles, lea el tutorial para aprendizaje profundo de Stanford:
- ¿Cuál es la forma correcta de crear consultas jerárquicas?
- ¿Qué IIT en India tiene el mejor programa de CS para el aprendizaje automático?
- ¿Qué piensa sobre los procesos gaussianos profundos?
- ¿Cómo utiliza Foursquare el aprendizaje automático para mejorar el producto?
- ¿Qué carrera es mejor, Machine Learning o DevOps?
CS231n Redes neuronales convolucionales para reconocimiento visual