¿Cuáles son algunas de las limitaciones o inconvenientes de las redes neuronales convolucionales?

No codifican la posición y orientación del objeto en sus predicciones.

Pierden por completo todos sus datos internos sobre la pose y la orientación del objeto y dirigen toda la información a las mismas neuronas que pueden no ser capaces de manejar este tipo de información.

Una CNN hace predicciones mirando una imagen y luego verificando si ciertos componentes están presentes en esa imagen o no. Si lo son, entonces clasifica esa imagen en consecuencia.

En una CNN, todos los detalles de bajo nivel se envían a todas las neuronas de nivel superior. Estas neuronas luego realizan convoluciones adicionales para verificar si ciertas características están presentes. Esto se hace caminando el campo receptivo y luego replicando el conocimiento en todas las neuronas diferentes

Según el profesor Hinton, si una neurona de nivel inferior ha identificado un oído, entonces tiene sentido enviar esta información a una neurona de nivel superior que se ocupa de identificar caras y no a una neurona que identifica sillas. Si la neurona facial de nivel superior obtiene mucha información que contiene tanto la posición como el grado de certeza de las neuronas de nivel inferior de la presencia de una nariz, dos ojos y un oído, entonces la neurona facial puede identificarla como una cara.

Su solución es tener cápsulas, o un grupo de neuronas, en capas inferiores para identificar ciertos patrones. Estas cápsulas generarían un vector de alta dimensión que contiene información sobre la probabilidad de la posición de un patrón y su pose. Estos valores serían luego alimentados a las cápsulas de nivel superior que toman múltiples entradas de muchas cápsulas de nivel inferior

Aprendizaje automáticoAprendizaje profundoconvolucionalesRedes neuronalesRedes neuronales artificiales

Related Content

¿Cuál es el tamaño mínimo de corpus para entrenar incrustaciones de palabras?

¿Por qué el impulso ayuda a entrenar una red neuronal?

¿Por qué el algoritmo AdaBoost es sensible a datos ruidosos y valores atípicos? ¿Y cómo?

¿Una máquina aprende una ciencia o un arte?

¿Cuántas horas le tomaría a un analista de datos profesional revisar los datos simples de la compañía y construir un modelo para predecir el desgaste?

Cómo cambiar la contraseña de un usuario de terminal Telnet en Linux

¿Crees que la investigación universal de perturbaciones adversas es justa en las redes neuronales profundas?

En Machine Learning. Una red neuronal convolucional es una clase de redes neuronales artificiales profundas y avanzadas que se han aplicado con éxito al análisis de imágenes visuales. Una red neuronal convolucional tiene algunos inconvenientes, algunos se enumeran a continuación
El ajuste de hiperparamter no es trivial
Necesita un gran conjunto de datos
La escala de los pesos de una red (y de las actualizaciones de peso) es muy importante para el rendimiento. Cuando las características son del mismo tipo (píxeles, recuento de palabras, etc.), esto no es un problema. Sin embargo, cuando las características son heterogéneas, como en muchos conjuntos de datos de Kaggle, sus pesos y actualizaciones estarán en diferentes escalas (por lo que debe estandarizar sus entradas de alguna manera).
económico
Una convolución es una operación significativamente más lenta que, por ejemplo, maxpool, tanto hacia adelante como hacia atrás. Si la red es bastante profunda, cada paso de entrenamiento tomará mucho más tiempo.

Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

Jack Lipton

CNN no es invariable para la rotación y la escala. Sin embargo, con la introducción de [1506.02025] Redes de transformadores espaciales, el problema de la invariancia de rotación se resuelve en buena medida. He realizado una amplia experimentación con transformadores espaciales. Funciona bien para imágenes de gran dimensión. Sin embargo, para imágenes de pequeña dimensión no funciona mejor que una CNN.

Además, si un transformador espacial se coloca en capas posteriores, tiende a funcionar mejor que colocarlo en las capas iniciales. En varios conjuntos de datos con los que trabajé, una red cuidadosamente diseñada con múltiples transformadores espaciales restringidos para rotar los mapas de características proporciona buenos aumentos de precisión.

Kumar Yashashwi

algunas desventajas:

-Alto costo computacional.

– Si no tienes una buena GPU, son bastante lentos para entrenar (para tareas complejas).

-Sueven necesitar muchos datos de entrenamiento.

Jack Lipton

More Interesting

¿Qué tiene de bueno la PNL?

Además de las universidades mejor clasificadas (# 1-20), ¿qué otra universidad ofrece un buen programa de maestría en informática con especialización en IA / ML en EE. UU.?

¿Qué elementos de los sistemas operativos generales de una organización deben ser compatibles y reforzarse mutuamente?

¿Debo aplicar PCA antes o después de la selección de funciones?

¿Qué es el aprendizaje supervisado?

¿Dónde estará (o podría) estar el Aprendizaje Profundo si la Ley de Moore continúa por otros 10-20 años?

¿Cuál es la diferencia entre Internet de las cosas y el aprendizaje automático y cuál debo aprender primero?

¿Cuál es la biblioteca de aprendizaje profundo más fácil de aprender?

¿Cuál es la diferencia entre Bayes ingenuo y la entropía máxima?

¿Cómo puede una red neuronal ser capaz de razonamiento simbólico? ¿Cómo puede unir variables?

¿Cómo toman decisiones las neuronas del cerebro? ¿Funcionan de la misma manera que las neuronas artificiales en ANN?

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

¿Cómo se usa la optimización bayesiana en la práctica?

¿Cuáles son los principales puntos de regresión?

¿El aprendizaje automático no supervisado basado en la agrupación de datos también determina automáticamente la cantidad de agrupaciones?

Web Analytics