Cómo elegir una red neuronal para la clasificación basada en la aplicación y cómo las capas ocultas afectan el rendimiento de la red neuronal

No existe un método único más utilizado como tal para decir que esta es la arquitectura correcta de la red requerida.

Una forma de hacerlo es construir una red más grande de lo necesario y usar varias técnicas de poda para reducir el tamaño de la red. Se utilizan técnicas como un cirujano cerebral óptimo basado en arpillera.

La otra forma es construir lentamente la red a partir de unidades más pequeñas de lo necesario y verificar la precisión, cuando la precisión se satura o cuando comienza a disminuir ligeramente (debido al sobreajuste) puede determinar el tamaño óptimo de la red.

El número de capas ocultas y el número de unidades ocultas en cada capa determinan en última instancia el grado de la línea de clasificación que obtenemos, según los datos, si la línea de clasificación es de tercer grado o más, podríamos necesitar más capas ocultas para generar ese complejo límite de decisión.

No estoy seguro de lo que quiere decir con ‘elegir una red neuronal basada en la aplicación’, aquí supongo que se refiere a la estructura de la red neuronal. Vea que siempre hay un problema de sesgo vs varianza (como con cualquier otro algoritmo de aprendizaje).

Y puede verificar esto a través de curvas como el diagrama de caja o a través de curvas de aprendizaje, el curso del profesor Andrew Ng sobre Coursera habla sobre ellas en detalle.

Una red más grande puede sobreajustarse, mientras que una más pequeña puede no aproximarse bien a la función (bajo ajuste).