Gran parte de la visión por computadora incluye el aprendizaje automático, y OpenCV incluye módulos de aprendizaje automático para su uso en aplicaciones de visión por computadora, por lo que este límite ya es borroso.
La línea interesante, tal vez, se encuentra entre aquellos aspectos de la visión por computadora (CV) que no utilizan el aprendizaje automático (ML) y los que sí lo hacen.
La base de la visión por computadora consiste en algoritmos para procesar imágenes fotográficas 2D del mundo. En este sentido, la visión por computadora es el problema inverso de los gráficos 3D por computadora: transformar imágenes 2D en una representación de escena.
- ¿Por qué tanta gente asocia la IA con la robótica?
- ¿Cuál es el propósito del sesgo en una neurona artificial?
- ¿La informática y la automatización son malas para la humanidad a medida que las máquinas se hacen cargo de más trabajos? O es bueno?
- Con el desarrollo acelerado de la IA, ¿creemos que es necesario, en algún momento, enseñar moral a los robots también?
- ¿Qué áreas de las matemáticas puras son relevantes para la IA?
Ingrese al aprendizaje automático.
Si bien la visión por computadora puede transformar matrices de píxeles 2D en una estructura 3D, lo que no puede hacer es comprender la escena. El mundo que les importa a los humanos es interpretable : ¿cuáles son las identidades de los objetos? ¿Hacia dónde va el camino que debe recorrer el auto sin conductor? ¿Qué dice el letrero? ¿Dónde están los obstáculos? Esta comprensión requiere el mapeo de la entrada visual en un modelo semántico del mundo, y esto es lo que requiere el aprendizaje automático.
Las redes neuronales convolucionales son un ejemplo de conexión de la visión por computadora al aprendizaje automático. El algoritmo de visión por computadora limpia la imagen y encuentra eficientemente las características estándar de bajo nivel. Luego, la capa de red neuronal convolucional mapea esas características en nombres conocidos de categorías de objetos a través del entrenamiento de aprendizaje automático.
En los algoritmos de automóviles autónomos, el espacio de características visuales, tal vez con un mapa de profundidad de objetos, se convierte en entrada para los modelos ML que asignan características de bajo nivel a características de alto nivel, y asignan características de alto nivel a acciones apropiadas.