¿Puede ser al revés? ¿Cómo justifica el uso de la transferencia de aprendizaje en lugar de usar un modelo más simple que aprende sus propias características?
El aprendizaje por transferencia todavía tiene sus limitaciones. Los modelos pre-entrenados como VGG / ResNet producen características muy útiles la mayor parte del tiempo, pero ¿qué pasa si su dominio está tan lejos de los datos en ImageNet, que la arquitectura y los pesos de VGG son un impedimento? ¿Puede ser una exageración? Porque si es así, llevará mucho tiempo volver a entrenar todo y obtener un resultado útil, haciendo que los esfuerzos para realizar el aprendizaje de transferencia sean inútiles.
Como ejemplo de la vida real, considere el problema de segmentación celular. ¿Cómo pueden contribuir las características aprendidas de un conjunto de datos de animales / aviones / personas / edificios a la detección de mitocondrias?
- ¿Cuál es la definición de 'conjunto de desarrollo' en el aprendizaje automático?
- Diseño de vectores de características para algoritmos de aprendizaje automático. ¿Debo poner características de diferentes dominios en el mismo vector?
- ¿Por qué el aprendizaje automático, las redes neuronales y otros enfoques de IA, por ejemplo, no se usan más ampliamente en las predicciones del mercado de valores?
- ¿Cuáles son algunos problemas de aprendizaje automático que están más allá del poder de scikit-learn para resolver?
- ¿Qué es un giroscopio? ¿Como funciona?
La otra gran diferencia es la formulación del problema, VGG / ResNet fueron diseñados para la clasificación multiclase, lo que significa que aprender mucha información irrelevante. Se puede resolver ajustando un VGG preentrenado aumentado con algunas capas aumentadas con unas pocas capas para la clasificación binaria, cambiando así la información “intra-red” de “perro-vs-gato-vs-rana-vs-casa” a “perro-no-perro”. El otro lado de dicha práctica es que la cantidad de pesos almacenados internamente también puede ser demasiado, lo que requerirá una regularización adicional … ¿por qué molestarse, cuando puede tomar una red más pequeña?
Probablemente sea uno de esos casos de “menos es más”, por lo que, con respecto a la pregunta del revisor, un análisis un poco más profundo de la tarea es muy útil.