¿Cuál es la diferencia entre la visión humana y la visión por computadora?

Hay muchas diferencias entre la forma en que los humanos percibimos las cosas y la forma en que lo hace un sistema informático.

  1. Los ojos: un ojo individual funciona casi de la misma manera que una cámara. la luz se mueve a través del sistema de lentes y cae sobre pequeñas células que funcionan como sensores y envían la imagen al cerebro. Al menos en este caso, las contrapartes artificiales han avanzado más que los ojos. Construimos cámaras especiales que graban la luz más allá del espectro visible, apilamos lentes para hacer zoom.
  2. A partir de aquí, las cosas se van rápidamente de las manos.
  • En nuestro cerebro, tienen lugar algunos procesos bastante complejos. En primer lugar, la alimentación de dos ojos se fusionan para que tengamos la sensación de distancia y profundidad. Podemos hacerlo fácilmente en visión artificial

incluso podemos hacerlo con una sola cámara RGBD también. Yaay!

  • Después de eso, con la ayuda de las diferencias de color, profundidad y detección de ángulos, de alguna manera logramos distinguir objetos. Es cierto que las computadoras también pueden hacer eso. Pero tenemos que entrenarlo para una tarea específica. Y nuestra mente lo hace todo el tiempo, y nunca lo sabemos.

  • No solo localizamos objetos dinámicamente, sino que también hacemos un seguimiento de su movimiento, velocidad y aceleración, todo sin esfuerzo. La próxima vez que atrapes una pelota, reflexiona sobre ella. Nuestros programas pueden hacerlo, pero, por supuesto, la mente humana es demasiado eficiente.

  • Identificando objetos. Lo que nuestro cerebro puede hacer es mucho mayor que cualquier cosa que hayamos logrado.
  • Ahora, las cosas se mueven ligeramente de la visión por computadora a la IA, y es un poco filosófico. ¿Qué pasa cuando piensas en perro?

imagina patrones, estructuras, formas y de alguna manera captura el amplio espectro desde chihuahua hasta bulldogs. Las computadoras entienden píxeles, números y matrices. Con las GAN podríamos estar allí. Pero todo lo que reproduce son imágenes como esta:

Sí, estas son imágenes de perros. Espeluznante, ¿no?


Espero que les haya gustado esta respuesta. Solo soy un estudiante, solo estoy tratando de pasar a estas cosas sorprendentes e interesantes. Entonces, si encuentra algún error, hágamelo saber en la sección de comentarios.

La visión humana es uno de los sistemas complejos en nuestro cuerpo. Casi la mitad del cerebro está dedicado al sistema visual. La visión por computadora se modela de manera similar a la percepción visual humana, aunque existen algunas diferencias. Echemos un vistazo a las similitudes:

1- Cuando alguien abre el periódico y ve una fotografía, el cerebro interpreta la fotografía como una imagen suave y clara. Sin embargo, cuando se inspecciona de cerca, la fotografía es en realidad una serie de pequeños puntos de tinta. El cerebro combina estos puntos para crear la apariencia de una imagen nítida.

Se permite el mismo proceso en la percepción de imágenes en una pantalla de computadora, que se presentan en forma de píxeles de información.

2- Cuando el cerebro se enfrenta a una escena que contiene varios objetos diferentes, no puede hacer un seguimiento de todos ellos a la vez. Entonces, en su lugar, crea un mapa aproximado de la escena que simplemente identifica algunas regiones como más interesantes visualmente que otras. Esta ventaja también se presenta en los sistemas de IA, es decir, toda la imagen se proporciona como entrada y solo se analiza el objeto de interés.

Ahora hablando de las diferencias:

1- Como todos saben, nuestro cerebro puede identificar cualquier objeto nuevo que vemos, pero por ahora, las computadoras realmente no pueden identificar el nuevo objeto que encuentran. Sin embargo, con el avance de la tecnología, el aprendizaje automático que entra en escena, las computadoras pueden ser entrenadas para analizar visualmente y reconocer cualquier objeto que vean.

Este proceso es bastante complejo. La computadora desglosó la imagen del objeto en componentes más pequeños y conocidos que puede identificar y luego identifican el objeto como un todo.

Todo dicho y hecho, la visión por computadora al menos en la actualidad no es rival para la percepción visual humana. Aunque la visión por computadora hoy ha progresado mucho con algoritmos para la detección de objetos, percepción, detección de rostros, etc., tenemos mucho por hacer.

More Interesting

Visión por computadora: ¿cuáles de los temas son necesarios antes de hacer un proyecto en opencv?

¿Ha habido casos en Informática de no investigadores que contribuyen fundamentalmente a la investigación?

¿Cuál es el algoritmo más eficiente para el mejor ajuste en el problema del embalaje del contenedor (bPP)?

¿Se necesita conocer la arquitectura de la computadora para comenzar a aprender los sistemas operativos?

Comenzando mi investigación de doctorado sobre sistemas de navegación con visión asistida. ¿Dónde puedo encontrar buenos recursos y referencias para la visión por computadora en la navegación?

Cómo realizar una investigación en informática

¿Cuál es la investigación reciente en informática? ¿Cómo puedo obtener un conocimiento profundo de alguna investigación o tema si deseo saber?

¿Se realiza más investigación de CS en la academia o la industria?

¿Por qué el uso del juego para mejorar la conciencia cultural no es un buen tema para la investigación en informática?

¿Cuáles son algunos campos crecientes y relativamente desconocidos de la informática (fuera de los campos como IA, criptografía, bioinformática, minería de datos)?

¿Hay conferencias de investigadores en informática que publican esfuerzos de investigación fallidos?

¿Cómo es estudiar datateknik (civ.ing) en la Universidad Tecnológica de Chalmers?

¿Qué conceptos y prácticas de metodología de investigación genérica se utilizan en el campo del aprendizaje automático?

¿Qué es una lista de investigadores en UCLA que están trabajando en la investigación de aprendizaje automático?

¿Por qué el PageRank es muy alto para los nodos en un gráfico con indegree cero?