¿Cuál es la mejor manera de realizar el aprendizaje de transferencia en una imagen monocroma (aprendizaje automático)?

Puede ajustar un modelo originalmente entrenado en imágenes en color al reemplazar la primera capa convolucional para tomar 1 canal de entrada en lugar de 3 (para RGB), además de reemplazar la última capa de clasificación completamente conectada para generar el número de clases en su nuevo conjunto de datos (por lo general, el ajuste fino implica solo reemplazar esta última capa).

Al ajustar, puede 1) congelar todos los demás pesos además de las capas reemplazadas y simplemente entrenar para los pesos en sus nuevas capas 2) reducir la tasa de aprendizaje de las capas originales en un factor de 10 en comparación con la del nuevo capas. Por lo general, la primera opción solo funciona bien si el nuevo conjunto de datos es “similar” al anterior. Dado que su conjunto de datos monocromático ya es sustancialmente diferente de Imagenet (el conjunto de datos en color en el que se capacita la mayoría de las redes), recomendaría la segunda opción.

En lugar de reemplazar por completo los pesos conv1, puede inicializar su nueva capa con los pesos preentrenados correspondientes a un canal de color; Esto podría ayudar a acelerar el entrenamiento de ajuste.