Redes neuronales artificiales: ¿Qué determina si un problema de clasificación no trivial para el aprendizaje profundo se puede dividir en capas convolucionales en lugar de capas completamente conectadas?

Las capas de convolución generalmente se usan cuando las entradas tienen alguna estructura espacial. Por ejemplo, si entrena un filtro para reconocer una imagen de una flor, entonces solo responderá cuando a) estén presentes las intensidades de píxeles correctas yb) los píxeles estén organizados de manera de formar una imagen de una flor. Si toma exactamente los mismos píxeles y los reorganiza aleatoriamente, la imagen ya no es de una flor. Esto significa que el contenido de una imagen depende no solo de los valores de píxeles individuales, sino también de cómo están dispuestos espacialmente esos píxeles. Si, por otro lado, su entrada no tiene información espacial, por ejemplo. una variedad de atributos, luego los filtros convolucionales realmente no tienen sentido.

Las capas completamente conectadas pueden, por supuesto, reemplazar las capas convolucionales: piense en una capa F_x, y para cada paso (x, y) que toma el filtro de convolución C, donde F_x, y aplica los mismos pesos que C a las entradas que se aplicaría el filtro a, y pone a cero todas las demás entradas. Sin embargo, como puede ver, el número de pesos involucrados es mucho mayor, por lo que esta red tardaría mucho más en entrenar.

Una respuesta corta (y probablemente incompleta): si los cambios de las dimensiones de entrada corresponden a los cambios de las dimensiones de salida, entonces las estructuras convolucionales probablemente tengan sentido.

Un ejemplo adecuado para ConvNet es el reconocimiento de objetos: un objeto (representado por patrones de intensidad) en una imagen tendrá el mismo significado, incluso si su ubicación cambia.

Un ejemplo (inventado) NO adecuado para que ConvNet clasifique los colores en función de los espectros: si una forma de onda cambia en el dominio de frecuencia del espectro, su significado cambia por completo.

More Interesting

¿Cómo se usa una capa oculta soft-max en una red neuronal profunda?

¿Cómo difiere la clasificación de la clasificación? ¿Cómo son similares?

¿Cómo debo seguir el curso de Andrew NG si quiero aprender el aprendizaje automático en Python y cómo debo progresar después de completar el curso?

Cuando la gente dice que la inteligencia artificial destruirá a la raza humana, ¿es que alguien los programará para que estén predispuestos a no gustarle la vida orgánica, o que de alguna manera adquirirán naturalmente las mismas emociones o algoritmos que lo llevan a uno a matar?

¿Cuál es la diferencia entre un ingenuo clasificador Bayes y una red bayesiana?

¿Cuándo y por qué un clasificador Bayes ingenuo es una opción mejor / peor que un clasificador forestal aleatorio?

¿Cómo decidimos qué algoritmo usar en el aprendizaje automático?

¿Qué tan importante es Octave como primer paso en Machine Learning? ¿Se utiliza en la industria?

Cómo integrar el marco Tensorflow con XGBoost

¿Cuál es una explicación intuitiva para el equilibrio de sesgo-varianza?

¿Cómo decidimos la clase de clústeres generados a través del clúster k-means?

¿Cuáles son algunas iniciativas de aprendizaje automático sobre datos sociales?

¿Cuál es el mejor método para la reducción de dimensionalidad y la selección / extracción de características en datos de espectrometría de masas?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

¿Cuál es una buena manera de clasificar los documentos de texto contra un modelo de tema arbitrario?