¿Cuál sería la arquitectura más apropiada para entrenar una red neuronal basada en dos imágenes de entrada?

No hay forma de saber cuál es la mejor arquitectura para esta tarea. Sin embargo, si supone que ambas imágenes siguen la misma distribución, puede usar los mismos filtros para extraer características de ellas. Es razonable que las características que son útiles cuando se extraen de la primera imagen también lo sean cuando se extraen de la segunda imagen.

Esto le daría dos CNN que comparten sus matrices de filtro. Compartir pesos tiene los beneficios habituales de tener menos parámetros para aprender y más datos para entrenarlos con precisión. Menos parámetros también significa menos potencial de sobreajuste. Luego puede combinar las características de más alto nivel de ambas usando algunas capas completamente conectadas.

Sí, este es un caso especial de convoluciones 3D, donde la tercera dimensión tiene un tamaño de filtro de 1 y sin zancadas. Pero creo que es más fácil para ti imaginar dos CNN que comparten sus pesos. Eso también es lo mismo que una CNN aplicada a ambas imágenes. Sin embargo, puede haber mejores arquitecturas, todo depende de su tarea precisa y de cómo la información que contiene depende entre sí.

Aprendizaje automáticoAprendizaje profundoInteligencia Artificialneuronales convolucionalesRedesRedes neuronales artificiales

Related Content

¿Cómo decide Gmail si un correo electrónico es promocional?

¿Algunas funciones de activación son mejores que otras en la red neuronal artificial?

¿Qué cursos de estadística de Harvard debería tomar si quiero aprender aprendizaje estadístico / aprendizaje automático?

¿Cuál es la fortaleza y la debilidad del departamento de CS de Caltech, especialmente en el área de Machine Learning?

¿Necesito implementar modelos de aprendizaje profundo desde cero?

¿Cómo escapa / resiste una red neuronal profunda a la maldición de la dimensionalidad?

¿Cómo se puede modelar la interacción Radar y Jammer a través del aprendizaje automático?

More Interesting

¿De qué maneras incorpora Snapchat el aprendizaje automático?

¿Por qué mi modelo de regresión produce valores negativos para SalePrice en los datos de prueba?

¿Cuál es su enfoque para el diseño de redes neuronales convolucionales?

¿Funciona el aprendizaje profundo si las entradas están en un espacio dimensional relativamente bajo?

¿Por qué la mayoría de las declaraciones de investigación de aprendizaje automático suenan a mierda?

¿Cómo se usa SVM y cómo se implementa mejor?

Cómo construir un sistema de calificación basado en comentarios usando Word2Vec (python)

¿Se puede entrenar la imagen usando la función de activación?

Cómo encontrar grupos en estos datos

Desde un punto de vista práctico, ¿por qué es tan importante saber programar en Machine Learning?

¿Necesito pasar al menos 1 año para repasar mis matemáticas antes de aprender el aprendizaje automático y el aprendizaje profundo?

¿Cuáles son los conceptos básicos de los campos aleatorios condicionales?

¿Qué son las vigas reforzadas sobrerreforzadas, subreforzadas y equilibradas?

¿Cómo es tomar 9.520 (teoría de aprendizaje estadístico) en el MIT?

¿De qué maneras alguien puede obtener ingresos del aprendizaje automático (trabajo por cuenta propia)?

Web Analytics