¿Por qué usamos convolución en redes neuronales?

La convolución es una forma de darle a la red un grado de invariancia de traducción.

Puede pensar en la convolución de imagen típica utilizada en las redes neuronales como una forma de desenfoque (aunque hay otros tipos de convoluciones que están más cerca de las derivadas espaciales). Este desenfoque asegura que la red neuronal responderá de manera similar a las versiones ligeramente desplazadas de una imagen o característica.

Las etapas convolucionales en las redes neuronales implican compartir pesos de conexión. Esto permite una detección robusta de características invariantes de posición. Digamos que alguna etapa de la red funciona como un detector de bordes. Le gustaría asegurarse de que el detector de bordes funciona de la misma manera, independientemente de en qué parte de la imagen se encuentre un borde. Una etapa convolucional en una red neuronal asegura que cada parte de la red neuronal tenga esencialmente el mismo detector de borde. Entonces, incluso si sus datos están sesgados para tener bordes solo en, digamos, el lado inferior izquierdo del conjunto de imágenes, sus pesos de conexión no reflejarán este sesgo sistemático.

Otras lecturas:

¿Por qué y cómo las redes neuronales convolucionales son invariantes en la traducción? – Quora

Red neuronal convolucional – Wikipedia

Redes neuronales y aprendizaje profundo.

Redes neuronales convolucionales (LeNet): este es un excelente tutorial sobre redes neuronales. Recomiendo crear su propia red, o al menos jugar con algún código existente. No hay sustituto para implementar su propia red. Solo hay mucho que puedas entender de la lectura pasiva.

Aprendizaje automáticoRedes neuronales artificialesRedes neuronales convolucionales

Related Content

Cómo resolver un problema de la máquina Atwood con fricción

¿Alguien ha usado ML para hacer un diseño * no trivial * de algoritmos CS de bajo nivel (ver comentarios)?

¿Se puede utilizar el aprendizaje automático para mejorar la situación de los agricultores en los países en desarrollo? En caso afirmativo, ¿cuál sería su enfoque?

Comencé a aprender Machine Learning pero estoy luchando con conceptos matemáticos como la regresión lineal. ¿Cuál debería ser mi punto de partida en tal caso?

¿Cuáles son los tipos de problemas que se pueden resolver con las redes neuronales?

Mientras entrena una red profunda, una vez que la precisión del entrenamiento alcanza el 100%, ¿hay algún punto en entrenar la red durante más épocas?

¿Cuál es el mejor truco informático?

More Interesting

¿Qué tan poderoso es la PNL?

¿Cuáles son las aplicaciones más prometedoras de ML / AI en el cuidado de la salud, excluyendo la informática de imágenes?

¿Se utilizan algoritmos básicos de CS en el aprendizaje automático?

Cómo implementar el muestreo ponderado de yacimientos

¿En qué medida se puede utilizar el aprendizaje automático y la IA en la detección y el tratamiento del cáncer?

¿Cómo podemos saber si una heurística es mejor que otra sin ejecutarla?

Cómo obtener un codificador automático de ruido para aprender una representación demasiado completa

¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV

¿Qué tipo de servicio suele ofrecer el inicio del procesamiento del lenguaje natural?

En la extracción de relaciones (PNL), ¿cuál es la diferencia entre la extracción de relaciones supervisada, semi-supervisada y no supervisada?

¿Cómo puede la regularización simplificar las hipótesis?

¿Qué se sabe sobre la detección de incertidumbre o vacilación en el texto en lenguaje natural (no en el habla)?

¿Una máquina aprende una ciencia o un arte?

¿Qué opinas sobre la inteligencia artificial? ¿Vale la pena desarrollarla?

¿Qué tan buena será una carrera en IA / aprendizaje automático en el futuro?

Web Analytics