No estoy muy seguro si estoy obteniendo la arquitectura (y los problemas que enfrenta) correctamente. Se me ocurrieron varias ideas y aquí hay algunas formas en que puedo pensar que puedes apilar redes.
- ¿Está tratando de aumentar la detección de objetos (¿dónde?) O la clasificación de objetos (¿qué?). Si está tratando de optimizar “¿qué?” (O incluso ambos), ¿por qué no cambiar a una arquitectura RCNN y coordinar las salidas en las primeras redes junto con la clasificación binaria para la presencia de objetos? Luego, pase los mapas de características como entradas agrupadas de ROI a la siguiente red de clasificación multiclase.
- Si está tratando de mejorar la precisión para el caso “¿dónde?”, Puede entrenar el mismo algoritmo repetidamente para analizar sus errores. Estos son métodos de minería de datos como la minería dura (donde se alimentan al mismo clasificador / regresor o sus errores en el conjunto de trenes) o apilamiento (donde se entrenan nuevos clasificadores / regresores solo para corregir errores).
- Si desea realizar una conexión en cascada (entrada de la segunda red <- salida de la segunda red) para la tarea "dónde", creo que puede encontrar algunos métodos inteligentes utilizando la agrupación de ROI de la que estaba hablando anteriormente. Es un concepto muy bueno si lo miras.