¿Cuál es su enfoque para el diseño de redes neuronales convolucionales?

Creo que la mejor guía para elegir una arquitectura de red neuronal sería asegurarse de que la estructura con la que termina pueda representar el conocimiento que desea capturar o la decisión que desea tomar.

La profundidad significa más riqueza en la representación del conocimiento jerárquico. Entonces, comenzaría con algo lo suficientemente grande como para representar datos complejos y tomar decisiones de la representación.

Entonces, supongamos que su arquitectura es demasiado grande, demasiadas capas, núcleos demasiado grandes o lo que sea. No le importa mientras pueda permitirse el tiempo de computación. ¿Por qué? Porque cuando coloca componentes superfluos en la red, el proceso de capacitación se asegurará de que los coeficientes de los componentes se capaciten para que la red pueda producir buenos resultados de todos modos.

El problema inverso no se resolverá tan fácilmente, es decir, tener una estructura incapaz de representar la decisión que debe tomar. Por lo tanto, cuando alcanza un resultado satisfactorio utilizando su gran red, puede comenzar a reducir la arquitectura e intentar acelerar el entrenamiento y también avanzar hacia la red.

¿Tiene sentido?

Visión por computadora: ¿Cuáles son los problemas abiertos para la recuperación de imágenes?

¿Qué enfoques utilizas para vectorizar funciones en Matlab?

¿Es factible construir su propia máquina fMRI?

¿Cuál es la diferencia entre análisis de datos, análisis de datos, minería de datos, ciencia de datos, aprendizaje automático y Big Data?

¿Cuál es una explicación intuitiva del ataque de cumpleaños en criptografía?

¿Funcionaría la búsqueda de ‘colocaciones’ de orden superior?

Al diseñar la topología de la red, puede considerar el campo receptivo local. Supongamos que está trabajando en imágenes de caras., Donde cada imagen es [matemática] 224 \ veces 224 \ veces 3 [/ matemática], y supongamos además que la región de la cara comprende aproximadamente [matemática] 160 \ veces 125 [/ matemática]. Estamos interesados en la región de la cara, por lo que cuando diseñe una red para esto, debe verificar el campo receptivo para asegurarse de que una sola salida provenga de una región de cara completa, es decir, [matemática] 160 \ veces 125 [/ matemática]. De lo contrario, nunca vemos una cara llena.

Recordar: campo receptivo significa el número de píxeles de entrada que se combinan para formar un único elemento de salida.

Amjad Shah

Creo que el primer paso es probar un modelo conocido que se propuso para un modelo similar (utilizando el aprendizaje de transferencia cuando sea posible), y tratar de comprender los pros y los contras. Luego puede leer documentos para ver si se puede adoptar alguna idea en otras redes para ajustar su estructura probada. Después de eso, puede tener una comprensión mucho más profunda del problema y el modelo. Es hora de que liberes tu imaginación.

José Pablo Alberto Andreotti

More Interesting

¿Cuáles son los problemas interesantes en la 'automatización de big data'?

¿Puedo seguir siendo un desarrollador de aprendizaje automático si tengo miedo a las matemáticas?

¿Podemos aplicar el filtrado colaborativo en la recomendación de noticias de última hora en línea?

¿Cuándo harán las máquinas la física y volverán a aprender las características de los datos de observación y luego reemplazarán aquellas como masa, giro, color o carga?

¿Qué tan bien funcionará una GTX 1060 en Windows para el aprendizaje profundo?

¿Vale la pena aprender Machine Learning (y AI) si quiero seguir la carrera de Ingeniero Embebido?

¿Cuál es la diferencia entre regresión lineal y logística?

¿Qué piensa la gente del concurso Quora ML CodeSprint 2013?

En Batch Normalization, ¿por qué se deben actualizar moving_mean y moving_variance?

¿Cuál es la definición de un 'prior bayesiano'?