¿Cuál es una explicación intuitiva para los parámetros de entrada para redes neuronales?

Gracias por A2A

Los parámetros para ANN son más o menos los mismos, por lo que me atendré al ejemplo del paquete nnet en R (página en r-project.org – para leer más).

Los parámetros más importantes aquí son la topología, la función física, el número o las iteraciones y la pérdida de peso.

La topología es un número de perceptrones en una capa oculta (intuitivamente – complejidad del modelo). Por lo general, se proporciona como un vector, definiendo el número de neuronas en cada capa (1 en nuestro caso).

Función Fitness : cuál es la medida del éxito para su modelo. En nnet usaron log-linear y entropía, pero puede ser cualquier cosa. En algunos casos en los que puede definir su propia función de condición física, puede influir en el resultado, pero en el caso de funciones de propósito general (por ejemplo, pérdida de Laplace o MSE), puede explicarse qué tan cerca están sus predicciones de los resultados reales para los ejemplos dados.

Número de iteraciones y criterios de detención : el algoritmo para calcular pesos óptimos en ANN es un ciclo con aproximaciones paso a paso. Eventualmente convergerá al punto donde la función de error en un conjunto de trenes será cero, pero no es necesario y no tenemos tiempo, por lo que para optimizar el rendimiento y evitar el sobreajuste, puede proporcionar la condición para la salida. En caso de varias iteraciones, el algoritmo realizará el procedimiento de recalcular los pesos N veces y se detendrá sin importar qué, en caso de margen de tolerancia se detendrá cuando el ajuste sea lo suficientemente bueno.

La disminución de peso es una alternativa a la tasa de aprendizaje, pero la diferencia es que cuando usa la disminución de peso, sus pesos disminuyen exponencialmente a cero cuando no se actualizan. Es necesario para evitar que el modelo se sobreajuste e intuitivamente puede entenderse como otra forma de regularización.