¿Cuál es la diferencia entre diferentes tamaños de kernel convolucional como 3 × 3 y 5 × 5? ¿Existe alguna teoría al respecto?

La diferencia es que el núcleo 3 × 3 está más centrado en las características localizadas de bajo nivel, mientras que el núcleo 5 × 5 está más centrado en las características de nivel superior.

A partir de ahora no hay ninguna teoría definitiva sobre cuál es el tamaño final que debe tener un núcleo, y es prácticamente un arte encontrar el tamaño de núcleo adecuado para el conjunto de datos con el que está trabajando.

En la práctica, apenas he visto núcleos más pequeños que 2 × 2 o más grandes que 5 × 5, cualquier cosa más pequeña o más grande simplemente no tendría demasiado sentido, o estás mirando la imagen píxel por píxel o tiras demasiado detalle.

También tenga en cuenta que el tamaño del kernel está estrechamente conectado a otros parámetros como zancada, agrupación y relleno cero, y no debe considerarse de forma aislada.

He encontrado el tutorial Una guía para principiantes para comprender las redes neuronales convolucionales para dar una explicación intuitiva de CNN, y debería darle una buena idea del funcionamiento interno de los núcleos.

Y por último, haz mucha experimentación.

More Interesting

¿Qué debo hacer para aprender el aprendizaje profundo, especialmente usarlo para resolver problemas?

¿Por qué cada filtro aprende diferentes características en una red neuronal convolucional?

¿Cuál es la mejor estrategia para un oponente de IA para predecir la ubicación y golpear la pelota en un juego de Pong?

¿Cuál es la diferencia entre el análisis de opinión y el análisis de tonalidad?

Cómo explicar la diferencia entre RPCA y PCA

¿Qué cantidad de sistemas de recomendación se trata solo de usar el algoritmo correcto?

Cómo detectar y eliminar valores atípicos de ese conjunto de datos

¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?

¿Cuál es su opinión sobre los rastros de elegibilidad para el aprendizaje de la diferencia temporal? ¿Es solo una asignación de crédito o un truco de aceleración?

¿Los métodos de aprendizaje automático son generales en comparación con los métodos de series temporales que se pueden llamar especializados?

¿La traducción automática alguna vez reemplazará a los traductores humanos? ¿Cómo podría una traducción automática comprender el contexto sociolingüístico de un texto?

¿Cuál es la diferencia entre una red neuronal y una red de codificador automático?

¿Por qué es tan difícil la IA? ¿Por qué todavía no hemos construido una máquina de IA?

¿Qué es la discretización de características?

¿Cuál es la explicación de la fórmula de compensación de Bias Variance?