El reconocimiento 2D se puede lograr con el uso de ANN y puede configurarse bien con grandes conjuntos de entrenamiento. Pero el razonamiento 2D es más complicado. Inherentemente involucra múltiples ‘cuadros’, vistas rotacionales, que están conectadas de formas complejas. Uno tiene que razonar para reconocer. El razonamiento implica pensar en el modelo. Pero mientras esté atascado solo con el reconocimiento de patrones estadísticos como herramienta, estará limitado. A menos que y hasta que el aprendizaje profundo evolucione hacia mejores arquitecturas que contengan capacidad de razonamiento, su capacidad será limitada.
Los mismos problemas también se aplican a las imágenes de secuencia de tiempo, es decir, video en movimiento. Sin razonar para conectar eventos en marcos, estarás algo limitado.
Ahora, donde esto es importante es en cosas como autos sin conductor, donde las secuencias de tiempo deben analizarse para formar los mejores modelos de lo que está sucediendo en el entorno. El reconocimiento simple de patrones tiene fallas en esto. Podría reconocer que algo que parece un perro aparece en un marco visual. ¿Y qué? Esto no me da información sobre las tendencias en el evento; ¡No sé si el perro está corriendo delante de mí o no, o incluso si es solo una imagen de un perro que el viento sopló frente a mí!
¿Podría el aprendizaje profundo vencer a los métodos tradicionales en 3D Vision?
Related Content
¿Alguna vez has observado que la normalización por lotes en realidad ralentiza el entrenamiento?
¿Cuál es el mejor código comercial de reconocimiento facial?
¿Cuáles son los principales niveles de clasificación de reclusos?
¿Cuáles son las ventajas de aprender Apache Spark?
¿Qué significa el valor propio de un hessiano en el aprendizaje automático?
More Interesting
¿Es el enlace neuronal una tecnología que podría funcionar?
¿Por qué podría ser preferible incluir menos predictores sobre muchos?
¿Por qué el impulso ayuda a entrenar una red neuronal?
¿Cuál es la diferencia entre un clasificador Naive Bayes y AODE?
Cómo convertir datos categóricos en numéricos por Excel
Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?
¿Siri es una forma de aprendizaje automático?
¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?