¿Qué es la poda neural? ¿Cómo sucede?

En el contexto de redes neuronales artificiales, la poda neuronal se utiliza para optimizar la arquitectura de la red neuronal para mejorar su rendimiento.

Las ANN más simples son redes neuronales completamente conectadas que tienen múltiples capas de neuronas completamente conectadas, conectando la entrada a la salida. Cada neurona en tales redes neuronales tiene una conexión ponderada con cada neurona / entrada de la capa anterior. Debido a que el número de conexiones en una red neuronal completamente conectada crece cuadráticamente con el crecimiento lineal de las neuronas en la capa, tales redes tienden a tener una gran cantidad de parámetros que necesitan ser entrenados.

Cuantos más parámetros tenga su red, mayor será su poder de modelado. Sin embargo, con un gran poder de modelado, existe una gran demanda del tamaño del conjunto de datos para evitar efectos secundarios como el sobreajuste, que disminuyen el rendimiento de la red en datos no vistos previamente (prueba). Por lo tanto, normalmente hay un número óptimo de parámetros que proporciona el rendimiento óptimo (por ejemplo, precisión en el conjunto de validación de sus datos), y si agrega más parámetros, el rendimiento solo disminuye.

La poda neuronal intenta mejorar el rendimiento de la red neuronal eliminando algunas conexiones en la red neuronal. Comienza con una red totalmente conectada y elimina las conexiones de la red neuronal siempre que mejore su rendimiento. La selección de las conexiones que se eliminarán se realiza mediante alguna heurística, por ejemplo, selección aleatoria, algún enfoque codicioso, algoritmo genético, etc.

Un artículo reciente sobre este tema es este. Consulte la sección 2 allí.