Gracias por el A2A.
Realmente hay dos enfoques para la visión artificial, que yo llamaría biológicos y basados en ingeniería . Las redes neuronales u otros procesos estadísticos pueden extraer información de una manera un tanto vaga, cuadriculada e inspirada orgánicamente. O puede realizar algoritmos como encontrar círculos, líneas y comparar con formas 3D internas explícitamente definidas.
El aprendizaje profundo con redes neuronales convolucionales es la última tendencia emocionante en visión artificial. De alguna manera imitan cómo nuestros cerebros procesan información visual a través de muchas capas de neuronas. Utilizan algoritmos de aprendizaje automático para aprender a clasificar las imágenes. Por ejemplo, muestre miles y miles de imágenes de gatitos y cachorros al sistema y dígale si es un gatito o un cachorro cada vez. Luego, puede mostrarle una nueva imagen de un gatito o cachorro, una que no haya visto, y le puede decir cuál de los dos animales es con una precisión impresionantemente alta. Suena muy simple, porque un niño promedio de 2 años puede hacer eso, pero no es simple. Esa habilidad había confundido a los investigadores de IA durante más de medio siglo.
- ¿Cómo empiezo a analizar una base de datos de análisis web?
- ¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?
- ¿Cuál es la divergencia KL entre un Gaussiano y un Student-t?
- ¿Cuál es una explicación intuitiva para el problema de optimización cuadrática?
- ¿Se utiliza el álgebra abstracta y el análisis real en el aprendizaje automático? Si es así, ¿cómo se usan?
El enfoque de ingeniería para la visión artificial es extraer cosas como círculos y líneas, usando cosas como la transformación de Hough y luego procesar a un nivel superior en las formas primitivas que se han encontrado y las relaciones entre ellas. La coincidencia de plantillas es un proceso de nivel bastante bajo que encuentra patrones en una imagen basada en una plantilla de memoria. Estos se están volviendo bastante sofisticados, con plantillas que incluso provienen de objetos renderizados internamente en 3D.