¿Cuál es la diferencia entre diferentes tamaños de kernel convolucional como 3 × 3 y 5 × 5? ¿Existe alguna teoría al respecto?

La diferencia es que el núcleo 3 × 3 está más centrado en las características localizadas de bajo nivel, mientras que el núcleo 5 × 5 está más centrado en las características de nivel superior.

A partir de ahora no hay ninguna teoría definitiva sobre cuál es el tamaño final que debe tener un núcleo, y es prácticamente un arte encontrar el tamaño de núcleo adecuado para el conjunto de datos con el que está trabajando.

En la práctica, apenas he visto núcleos más pequeños que 2 × 2 o más grandes que 5 × 5, cualquier cosa más pequeña o más grande simplemente no tendría demasiado sentido, o estás mirando la imagen píxel por píxel o tiras demasiado detalle.

También tenga en cuenta que el tamaño del kernel está estrechamente conectado a otros parámetros como zancada, agrupación y relleno cero, y no debe considerarse de forma aislada.

He encontrado el tutorial Una guía para principiantes para comprender las redes neuronales convolucionales para dar una explicación intuitiva de CNN, y debería darle una buena idea del funcionamiento interno de los núcleos.

Y por último, haz mucha experimentación.

Aprendizaje automáticoconvolucionalesKernelKernel de LinuxRedes neuronalesRedes neuronales artificiales

Related Content

Cómo desarrollar una recuperación de imagen basada en contenido

¿Cómo empiezo a analizar una base de datos de análisis web?

Visión por computadora: ¿cómo es la detección de objetos usando los puntos clave SIFT escala / rotacionalmente invariante?

Para un problema de clasificación (dos clases), ¿es mejor usar dos salidas con softmax o una salida con entropía cruzada binaria?

¿Cuáles son algunos de los grandes usos de Google TensorFlow?

¿Por qué algunos procesadores más baratos tienen una frecuencia de reloj más alta (número de GHz) a veces?

¿Qué es la regularización neta elástica en el aprendizaje automático?

More Interesting

¿Qué debo hacer para aprender el aprendizaje profundo, especialmente usarlo para resolver problemas?

¿Por qué cada filtro aprende diferentes características en una red neuronal convolucional?

¿Cuál es la mejor estrategia para un oponente de IA para predecir la ubicación y golpear la pelota en un juego de Pong?

¿Cuál es la diferencia entre el análisis de opinión y el análisis de tonalidad?

Cómo explicar la diferencia entre RPCA y PCA

¿Qué cantidad de sistemas de recomendación se trata solo de usar el algoritmo correcto?

Cómo detectar y eliminar valores atípicos de ese conjunto de datos

¿Qué es mejor para mí como estudiante? ¿Debería codificar los modelos de aprendizaje automático (donde pueda) o debería usar la biblioteca tanto como pueda?

¿Cuál es su opinión sobre los rastros de elegibilidad para el aprendizaje de la diferencia temporal? ¿Es solo una asignación de crédito o un truco de aceleración?

¿Los métodos de aprendizaje automático son generales en comparación con los métodos de series temporales que se pueden llamar especializados?

¿La traducción automática alguna vez reemplazará a los traductores humanos? ¿Cómo podría una traducción automática comprender el contexto sociolingüístico de un texto?

¿Cuál es la diferencia entre una red neuronal y una red de codificador automático?

¿Por qué es tan difícil la IA? ¿Por qué todavía no hemos construido una máquina de IA?

¿Qué es la discretización de características?

¿Cuál es la explicación de la fórmula de compensación de Bias Variance?

Web Analytics