¿Podría el aprendizaje profundo vencer a los métodos tradicionales en 3D Vision?

El reconocimiento 2D se puede lograr con el uso de ANN y puede configurarse bien con grandes conjuntos de entrenamiento. Pero el razonamiento 2D es más complicado. Inherentemente involucra múltiples ‘cuadros’, vistas rotacionales, que están conectadas de formas complejas. Uno tiene que razonar para reconocer. El razonamiento implica pensar en el modelo. Pero mientras esté atascado solo con el reconocimiento de patrones estadísticos como herramienta, estará limitado. A menos que y hasta que el aprendizaje profundo evolucione hacia mejores arquitecturas que contengan capacidad de razonamiento, su capacidad será limitada.
Los mismos problemas también se aplican a las imágenes de secuencia de tiempo, es decir, video en movimiento. Sin razonar para conectar eventos en marcos, estarás algo limitado.
Ahora, donde esto es importante es en cosas como autos sin conductor, donde las secuencias de tiempo deben analizarse para formar los mejores modelos de lo que está sucediendo en el entorno. El reconocimiento simple de patrones tiene fallas en esto. Podría reconocer que algo que parece un perro aparece en un marco visual. ¿Y qué? Esto no me da información sobre las tendencias en el evento; ¡No sé si el perro está corriendo delante de mí o no, o incluso si es solo una imagen de un perro que el viento sopló frente a mí!

Related Content

¿Alguna vez has observado que la normalización por lotes en realidad ralentiza el entrenamiento?

¿Cuál es el mejor código comercial de reconocimiento facial?

¿Cuáles son los principales niveles de clasificación de reclusos?

¿Cuáles son las ventajas de aprender Apache Spark?

¿Qué significa el valor propio de un hessiano en el aprendizaje automático?

¿Es posible que alguien piratee mi computadora portátil o móvil usando mi wifi, y alguien puede piratear mi wifi protegido con contraseña?

¿Cuál es la ventaja de tener en cuenta la curvatura al optimizar las redes neuronales profundas?

More Interesting

¿Hay tutoriales o trabajos de investigación sobre la presentación de problemas matemáticos como pseudolenguaje al algoritmo de PNL?

¿Es el enlace neuronal una tecnología que podría funcionar?

¿Cuáles son los documentos que debería leer sobre los sistemas de recomendación basados en el aprendizaje profundo?

¿Por qué podría ser preferible incluir menos predictores sobre muchos?

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

¿Por qué el impulso ayuda a entrenar una red neuronal?

¿Cuál es la diferencia entre un clasificador Naive Bayes y AODE?

Cómo convertir datos categóricos en numéricos por Excel

¿Es factible hacer una regresión logística en conjuntos de datos con miles de características sin usar una computadora de clúster? ¿Qué tal decenas de miles?

¿Cuáles son los algoritmos de aprendizaje automático adecuados para Big Data o análisis en tiempo real?

Como principiante en el procesamiento del lenguaje natural, ¿desde dónde debo comenzar?

¿Dónde puedo encontrar una biblioteca pública de algoritmos de aprendizaje automático (ML) y aprendizaje profundo (DL) con muestras?

En finanzas cuantitativas, ¿hay alguna analogía entre la optimización de la cartera y el análisis de componentes principales?

¿Siri es una forma de aprendizaje automático?

¿Cómo es un proyecto de visión por computadora "típico", de principio a fin?

Web Analytics