¿Por qué un niño de 6 años puede realizar tareas de reconocimiento de objetos mejor que una red neuronal distribuida a gran escala con decenas de miles de núcleos de CPU, pero incluso un cerebro adulto no puede competir con un procesador anticuado cuando se trata de cálculos de procedimientos? ¿Qué falta en nuestro procesador?

La pregunta aborda muchos problemas al mismo tiempo. Vamos a desglosarlos.

Parte 1: ” un niño de 6 años puede realizar tareas de reconocimiento de objetos mejor que una red neuronal distribuida a gran escala con decenas de miles de núcleos de CPU

Esto es, en el mejor de los casos, en parte cierto. Hay muchos casos en los que el cerebro de un niño funciona mejor que los actuales sistemas de reconocimiento de objetos generales en términos de precisión. Estos casos están más relacionados con el problema de encontrar un objeto 3D complejo en una escena natural donde el cerebro humano (tanto niños como adultos) supera a los modelos de computadora.

Otro problema puede ser encontrar un objeto 2D simple que se muestre entre un corpus grande de otros objetos 2D “similares”. Aquí es donde el cerebro humano tendrá problemas debido a la atención. La atención es un método utilizado por la corteza para dar sentido a las toneladas de datos que bombardean el sistema visual cada segundo. Simplemente ignora la mayor parte. Un niño / humano tendría que realizar una exploración lineal exhaustiva a través del cuerpo comparando el patrón deseado con el del campo de atención. En cambio, se puede hacer que una computadora realice esta tarea en paralelo y no necesite atención modelada. Vencería a un humano cualquier día hasta el final de los tiempos en todos los sentidos.

El problema con las redes grandes con decenas de miles de núcleos no es uno de hardware (tal vez), sino que se trata de lo que esas redes almacenan o aprenden. Tenemos mucho conocimiento y, de hecho, modelos matemáticos de lo que hace la corteza visual temprana (retina a LGN a V1 a V4). Parecen estar aprendiendo más de una manera no supervisada en lugar de la tendencia actual de aprendizaje profundo supervisado.

Parte 2: ” un cerebro adulto no puede competir con un procesador anticuado cuando se trata de cálculos procesales

El cerebro adulto no puede competir con un procesador en el sentido tradicional, por cálculos de procedimiento porque, de hecho, no está destinado a hacerlo. El cerebro humano se adapta y se vuelve experto en procesar la forma más abundante de información, es decir, perceptiva (visual, auditiva, etc.). Si esto se debe a influencias genéticas o naturalmente debido al desarrollo del cerebro o ambos, aún podría ser una pregunta abierta. Al procesar la información perceptiva, el cerebro aprende a “dar sentido” a los datos sin procesar durante mucho tiempo. Y, de hecho, dar sentido a la información perceptiva es un problema muy difícil (NP-hard en el caso general). Esto es mucho más difícil que decir sumar números (debido a la naturaleza del problema, la escalabilidad, etc.). Los cálculos de procedimiento son mucho más simples que, por ejemplo, representaciones de aprendizaje. El cerebro humano sobresale en este último y, por lo tanto, no estoy seguro de si el hecho de que las computadoras sobresalgan en el primero sigue siendo impresionante.

Dicho y hecho, estoy seguro de que con el tiempo tendremos una mejor comprensión de la complejidad del problema de aprendizaje y desarrollaremos algoritmos altamente eficientes. Estos aprenderían órdenes de magnitud más rápido que el cerebro infantil y pueden diseñarse para ser “mejores” que cualquier cerebro real para cualquier tarea específica.

También es interesante contemplar que habrá un momento en el futuro, cuando un sistema inteligente finalmente comprenda por qué es inteligente. Entonces habríamos alcanzado la llamada singularidad.

El número de núcleos no importa tanto en términos de resolución de problemas. Muchos animales tienen cerebros mucho más grandes que los humanos, pero aún no pueden realizar muchas de las tareas básicas de resolución de problemas que un humano puede realizar fácilmente. El problema es que incluso con tanta potencia de cálculo, realmente no tenemos un buen software para ejecutarlo.

Eso es porque

  • Actualmente, las computadoras no pueden implementar el proceso exacto que entrena al cerebro humano en el reconocimiento de objetos. No conocemos ese proceso.
  • Tampoco sabemos la representación exacta de la luz utilizada por el proceso del cerebro.
  • Ni siquiera sabemos si hay una parte separada que convierta la luz en una representación y una más que clasifique esa representación, o si reconocer imágenes es solo una buena representación.

En resumen, el problema radica en el nivel de diseño del algoritmo, no en la implementación.

Para ser justos, hemos avanzado mucho con respecto a las teorías que explican el mecanismo del cerebro, pero todavía no hemos llegado.

More Interesting

¿Cuáles son los algoritmos de aprendizaje automático adecuados para Big Data o análisis en tiempo real?

¿Cuál es el mejor curso de aprendizaje automático en Hyderabad?

¿Cuál es la mejor estructura de base de datos para almacenar y consultar conjuntos de datos grandes?

En los Estados Unidos, ¿es ilegal entrenar redes neuronales usando imágenes con derechos de autor?

¿Cuál es la mejor manera de predecir una clase +/- en un escenario de aprendizaje automático donde tengo k características trinarias y un conjunto de datos del orden de cientos o miles?

Construcción del modelo de correlación / regresión: ¿Cuándo debo usar variables dependientes / independientes reales, y cuándo debo usar sus tasas de crecimiento?

¿Cuándo debo usar inferencia variacional versus maximización de expectativas para ajustar un modelo de mezcla gaussiana?

¿El antiguo guardia de IA ha frenado la investigación de aprendizaje automático en el MIT?

¿Se pueden usar datos generados por simulación por computadora para algoritmos de aprendizaje automático?

¿Qué piensan los expertos en sistemas de recomendación sobre el documento 'Estimación del impacto causal de los sistemas de recomendación a partir de datos de observación'?

¿Cómo debe comenzar un principiante con la investigación en Machine Learning?

¿Qué sucede cuando las computadoras aprenden a componer música mejor que los humanos?

Estoy creando una plataforma de transmisión en vivo: ¿cómo puedo conectarme y usar varias cámaras web al mismo tiempo?

¿Qué es un sistema o algoritmo de recomendación que dice 'Dado que consumiste X {a} veces, Y {b} veces y Z {c} veces, ¿cuál de {X, Y, Z} debería recomendarte que consumas a continuación'?

¿Cuál es la relación entre K-means y PCA?