¿Por qué las redes neuronales artificiales son “cajas negras”?

Cuando la gente dice: “Las redes neuronales son cajas negras”, lo que quieren decir es que es difícil “mirar” dentro de la red y descubrir exactamente lo que ha aprendido.

En una tubería hecha a mano, sabes exactamente lo que estás construyendo. Entonces puede decir: “mi detector de rostro primero buscará las cejas, luego la boca, y solo si ambos están presentes, dirá ‘cara'”.

Para modelos simples de aprendizaje automático, como SVM lineales o regresión lineal, puede “mirar” dentro del modelo y ver qué está haciendo realmente (bueno, más o menos). El modelo en este caso es solo una combinación lineal ponderada de las características y, por lo tanto, una característica que el modelo pondera altamente es probablemente importante para la tarea, mientras que una característica no ponderada es probablemente irrelevante (esta es una gran simplificación excesiva) *.

Sin embargo, si su modelo es aprendido, de extremo a extremo, así como altamente no lineal, como en una red neuronal, no puede hacer esto. Usted sabe que el modelo es una combinación no lineal de algunas neuronas, cada una de las cuales es una combinación no lineal de otras neuronas, pero es casi imposible decir qué está haciendo cada neurona.

Esto es una desventaja si la interpretación del modelo es importante para usted. Por ejemplo, tal vez quieras demostrar que la red neuronal es un modelo del cerebro humano y quieres poder decir “La capa 6 detecta caras”. Alternativamente, puede asegurarse de que la red esté aprendiendo algo sensato y general y no algo específico para el conjunto de datos elegido. También es posible que desee obtener algunas intuiciones que pueden ayudarlo a mejorar en otras tareas. En general, “¡funciona!” no satisface realmente la curiosidad científica, por lo que esta opacidad de las redes neuronales es un poco frustrante.

* En la práctica, incluso los modelos lineales de un tamaño razonable son difíciles de entender, porque el modelo generalmente termina agregando pequeñas contribuciones de una gran cantidad de características.