¿Hasta dónde hemos llegado en términos de modelado de visión? ¿Cuánto entendemos acerca de cómo se procesa la información de la visión para formar una imagen? La tecnología cambia la vida futura

Depende de lo que quieras decir con una imagen.

Por lo tanto, la óptica se entiende bastante bien. La luz golpea tu ojo y se enfoca por la lente en la retina. La retina contiene conos y bastones que responden al color y bastones que no. En este punto, su ojo no es tan diferente a una cámara digital.

Los conos y bastones activados por la luz que los golpea a su vez hacen que las neuronas se disparen y dirijan la información a la corteza visual.

¿Qué tan bueno es el departamento de informática en la Universidad de Wisconsin, Madison para la escuela de posgrado?
¿La investigación académica va a la zaga de la investigación de la industria? Si es así, ¿en qué grado?
¿Cuáles son las áreas de investigación en informática?
¿Cuáles son los pasos necesarios para escribir trabajos de investigación?
¿Cuáles son los problemas abiertos en Computer Vision en los que se está investigando mucho?

La parte divertida viene de cómo el cerebro da sentido a esta imagen.

Según la psicología del desarrollo, sabemos que el cerebro es mejor para recordar ciertas cosas (caras en particular) y con el tiempo otras habilidades entran en acción (como la percepción de profundidad, por ejemplo). Es relativamente seguro decir que ciertas partes de los sistemas de procesamiento de imágenes en el cerebro están construidas en estructuras y tienen poco que ver con el aprendizaje.

Sobre la base de eso, el proceso es el entrenamiento mental continuo para poder identificar objetos a través del reconocimiento de patrones, y también sabemos que un gran aspecto de esto es identificar lo que el objeto que estamos viendo no es (el mismo proceso por el que pasan los niños) cuando señalan a un perro y lo llaman gato porque lo vieron antes, y sus padres explican que en realidad es un perro).

Además de eso, mucha identificación de imagen también proviene de poder leer el contexto de la imagen. Por ejemplo, aprendemos a aproximar el tamaño de los objetos en función de cuán grandes sabemos que son los objetos cercanos.

Fuente: Objetos grandes tomados como miniaturas usando una moneda gigante y efectos de cambio de inclinación

Cómo sucede esto a nivel neurológico es en gran medida una conjetura en este momento.

Actualmente tenemos un software de reconocimiento de texto que está mejorando en la lectura del texto (o al menos en la identificación de caracteres dentro del texto). Sin embargo, gran parte de la mejora proviene de poder leer el contexto / gramática y del entrenamiento humano.

De manera similar, hay avances en la identificación de objetos en imágenes, pero, según tengo entendido, los enfoques actuales carecen de la capacidad humana para crear ideas abstractas de las cosas (es decir, crear algún modelo internalizado de “taza” que luego puede aplicarse para identificar una taza que usted nunca he visto antes). Del mismo modo, el contexto es muy difícil de enseñar a una computadora a entender (Juego divertido: Intenta descubrir cómo explicarle a una computadora la diferencia entre un niño gótico vestido de negro parado en un cementerio para el efecto y otra persona vestida de negro parado en un cementerio durante un entierro)

Ciencias de la computaciónComputaciónInvestigación en ciencias de laNeurociencianeurociencia computacionalVisiónVisión por computadora