¿Cuál es el propósito del sesgo en una neurona artificial?

Piense en un perceptrón básico que realiza una clasificación binaria, donde solo hay una neurona de salida y dos neuronas de entrada que están conectadas a esta salida. Esto es esencialmente una regresión lineal, y está ajustando una línea que dividirá el espacio de entrada en dos regiones. Si no tiene una unidad de sesgo para la neurona artificial individual, está restringiendo su elección de hipótesis (la hipótesis es la línea de separación en este ejemplo) a las líneas que pasan por el origen, mientras que con un sesgo, puede hacer cualquier línea. Claramente, el sesgo nos permite elegir muchas hipótesis nuevas, y muchos espacios 2D de clasificación binaria necesitan una línea que no pase por el origen.

En una neurona en una red neuronal más normal, eso no es una salida y no solo tiene dos entradas, lo que está haciendo es definir un hiperplano y calcular el grado en que la entrada está por encima o por debajo del hiperplano (y luego aplicando una activación en esto). Si no tiene una unidad de polarización, está obligando a este hiperplano diferenciador a pasar por el origen, lo que generalmente no se desea.

El sesgo mueve la función de activación en una dirección que puede mejorar el aprendizaje. Papel del sesgo en las redes neuronales