¿Cómo podemos combinar dos redes neuronales profundas y entrenarlas de extremo a extremo?

No estoy muy seguro si estoy obteniendo la arquitectura (y los problemas que enfrenta) correctamente. Se me ocurrieron varias ideas y aquí hay algunas formas en que puedo pensar que puedes apilar redes.

¿Está tratando de aumentar la detección de objetos (¿dónde?) O la clasificación de objetos (¿qué?). Si está tratando de optimizar “¿qué?” (O incluso ambos), ¿por qué no cambiar a una arquitectura RCNN y coordinar las salidas en las primeras redes junto con la clasificación binaria para la presencia de objetos? Luego, pase los mapas de características como entradas agrupadas de ROI a la siguiente red de clasificación multiclase.
Si está tratando de mejorar la precisión para el caso “¿dónde?”, Puede entrenar el mismo algoritmo repetidamente para analizar sus errores. Estos son métodos de minería de datos como la minería dura (donde se alimentan al mismo clasificador / regresor o sus errores en el conjunto de trenes) o apilamiento (donde se entrenan nuevos clasificadores / regresores solo para corregir errores).
Si desea realizar una conexión en cascada (entrada de la segunda red <- salida de la segunda red) para la tarea "dónde", creo que puede encontrar algunos métodos inteligentes utilizando la agrupación de ROI de la que estaba hablando anteriormente. Es un concepto muy bueno si lo miras.

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

¿Cuáles son los algoritmos de aprendizaje profundo más importantes? ¿En qué orden debo aprenderlos?

¿Es R-cuadrado el mejor indicador de la calidad de una red neuronal?

¿En qué parte de mi red neuronal implemento la función de costo?

Si el hombre alcanza la tecnología / inteligencia / IA / singularidad, la IA futura reiniciará un Big Bang, ¿es posible que seamos nuestros propios creadores?

Cómo encontrar cámaras ocultas en una habitación

¿Son mónada (programación funcional) y clase (programación orientada a objetos) la misma cosa?

Es posible que desee echar un vistazo al marco de chainer para el aprendizaje profundo. A continuación hay un enlace a un fragmento de código para implementar LRCN (LSTM + CNN) usando el marco de chainer.

ennnyo / LRCN

Muktabh Mayank

Si desea utilizar una red neuronal multicapa, no envíe las coordenadas y la clase al final de la primera capa, debe hacerlo al final de la última capa que deja, las dimensiones de entrada y salida de la primera capa deben igualarse. para que la salida de la primera capa se alimente a la segunda capa y así sucesivamente. digamos, n capas. Al final de esta enésima capa, intente obtener la salida según sea necesario, es decir, las coordenadas y la clase.

Akash Jain

La agrupación máxima es una forma común de combinar entradas de dos redes neuronales profundas (DNN) diferentes.

Arindam Paul

More Interesting

¿Cuáles serán algunos de los principales trabajos creados en el futuro como resultado de la automatización y la inteligencia artificial?

¿Cuál es la intuición detrás de las redes neuronales?

¿El concepto de inteligencia artificial excluye la noción de conciencia artificial y emoción artificial?

¿Cuáles son las principales diferencias entre la inteligencia adaptativa y el aprendizaje por refuerzo?

¿En qué se diferencia la IA de la coincidencia de patrones básicamente?

¿Qué se 'propaga' durante la retropropagación?

¿Cuáles son algunos recursos para aprender la predicción usando redes neuronales?

¿Alguien puede darme la comparación de costos de SAAS disponibles para ejecutar redes neuronales profundas?