¿Cuál es la función de paso de unidad en la red neuronal artificial?

La función de paso de unidad Heaviside es solo f (x) = x> = 0. Es decir, es la derivada de la función ReLU.

No se usa mucho en los ANN prácticos, pero tiene una serie de atributos que lo hacen muy útil en análisis teóricos y redes experimentales:

Su salida es solo un bit. Por lo tanto, ejecutar una capa de salida a través de una función de paso por canal pone un límite superior estricto en la información que se puede codificar / entropía máxima de la capa de salida.
Al igual que el punto anterior, N funciones de paso unitario (cada una con un sesgo) codifican trivialmente un N vector caliente de bits con información log2 (N) de un único canal de entrada continuo. Use Jenks Natural Breaks o similar para elegir sesgos.
Usando 1 y 2, la función de paso de unidad es la forma más básica de agregar no linealidad a una red de múltiples capas. Por ejemplo, puede procesar las entradas MNIST (8 bits por 784) utilizando el punto 2 para obtener, por ejemplo, <3 bits por 784, luego entrenar una capa lineal y obtener un mejor resultado (93% frente a 92%)
Agregar ruido gaussiano a la entrada de la función de paso de unidad le da un gradiente sigmoide efectivo. para que los ruidosos modelos SGD y RBM puedan funcionar con él.

¿Puede una red neuronal artificial entrenar algún tipo de datos?

¿Qué es el modelado estadístico? ¿Y qué son los "métodos no estadísticos" en Machine Learning?

¿Qué significa el término aumento de datos en el contexto del aprendizaje automático?

¿Cuál es el significado de Machine Learning en el espacio emergente de ChatBot?

¿No son las redes neuronales solo máquinas de estado?

¿Existe una solución analítica para la regresión logística, similar a la de la ecuación normal para la regresión lineal?

La función de paso unitario, matemáticamente hablando, es una función así:

Pero tal función no es diferenciable porque hay una discontinuidad en cero. Entonces, en la práctica, cuando se entrena con propagación hacia atrás, esta función no se utiliza. En cambio, se usa el sigmoide, o alguna otra función suave.

Leticia Lorena Rodriguez

La función de paso es una función matemática que devuelve:

0 si x <0
1 si x> = 0

Este es el gráfico:

Esta función se utiliza en redes neuronales como una función de activación.

Las funciones de activación se aplican a los resultados de cada capa para “aplastar” los resultados. Si usa la función de paso , la salida de la capa será 0 o 1, dependiendo del valor original, negativo o positivo.

Leticia Lorena Rodriguez

More Interesting

¿Dónde dibujan la inteligencia artificial y la inteligencia humana una línea muy fina?

En una escala de 0-10, ¿cuánto conocimiento de aprendizaje profundo obtendrá después de completar la especialización deeplearning.ai?

¿Las computadoras reemplazarán a los intérpretes / traductores humanos en 10 años?

En el aprendizaje automático, ¿cuál es la diferencia entre los términos aprendizaje de transferencia, aprendizaje multitarea, transferencia inductiva, metaaprendizaje y aprendizaje para aprender?

¿Son los robots humanoides, o autos autónomos, solo una colección de componentes robóticos ensamblados?

¿Cuál es la diferencia entre inteligencia artificial y natural?

Douglas Hofstadter (científico cognitivo): ¿Qué, según "Soy un bucle extraño", hace que los humanos desarrollemos un sentido de "yo"?

¿Quora alguna vez se volverá consciente de sí mismo, dada su gran reserva de conocimiento?

¿Por qué la minimización de la divergencia de KL ayuda en la convergencia de algoritmos de aprendizaje automático?

¿Qué tipos de algoritmos de aprendizaje automático son buenos para aprender representación? ¿Es solo aprendizaje profundo?