¿Cuál es la función de paso de unidad en la red neuronal artificial?

La función de paso de unidad Heaviside es solo f (x) = x> = 0. Es decir, es la derivada de la función ReLU.

No se usa mucho en los ANN prácticos, pero tiene una serie de atributos que lo hacen muy útil en análisis teóricos y redes experimentales:

  1. Su salida es solo un bit. Por lo tanto, ejecutar una capa de salida a través de una función de paso por canal pone un límite superior estricto en la información que se puede codificar / entropía máxima de la capa de salida.
  2. Al igual que el punto anterior, N funciones de paso unitario (cada una con un sesgo) codifican trivialmente un N vector caliente de bits con información log2 (N) de un único canal de entrada continuo. Use Jenks Natural Breaks o similar para elegir sesgos.
  3. Usando 1 y 2, la función de paso de unidad es la forma más básica de agregar no linealidad a una red de múltiples capas. Por ejemplo, puede procesar las entradas MNIST (8 bits por 784) utilizando el punto 2 para obtener, por ejemplo, <3 bits por 784, luego entrenar una capa lineal y obtener un mejor resultado (93% frente a 92%)
  4. Agregar ruido gaussiano a la entrada de la función de paso de unidad le da un gradiente sigmoide efectivo. para que los ruidosos modelos SGD y RBM puedan funcionar con él.

La función de paso unitario, matemáticamente hablando, es una función así:

Pero tal función no es diferenciable porque hay una discontinuidad en cero. Entonces, en la práctica, cuando se entrena con propagación hacia atrás, esta función no se utiliza. En cambio, se usa el sigmoide, o alguna otra función suave.

La función de paso es una función matemática que devuelve:

  • 0 si x <0
  • 1 si x> = 0

Este es el gráfico:

Esta función se utiliza en redes neuronales como una función de activación.

Las funciones de activación se aplican a los resultados de cada capa para “aplastar” los resultados. Si usa la función de paso , la salida de la capa será 0 o 1, dependiendo del valor original, negativo o positivo.

More Interesting

¿Dónde dibujan la inteligencia artificial y la inteligencia humana una línea muy fina?

En una escala de 0-10, ¿cuánto conocimiento de aprendizaje profundo obtendrá después de completar la especialización deeplearning.ai?

¿Las computadoras reemplazarán a los intérpretes / traductores humanos en 10 años?

En el aprendizaje automático, ¿cuál es la diferencia entre los términos aprendizaje de transferencia, aprendizaje multitarea, transferencia inductiva, metaaprendizaje y aprendizaje para aprender?

¿Son los robots humanoides, o autos autónomos, solo una colección de componentes robóticos ensamblados?

¿Cuál es la diferencia entre inteligencia artificial y natural?

Douglas Hofstadter (científico cognitivo): ¿Qué, según "Soy un bucle extraño", hace que los humanos desarrollemos un sentido de "yo"?

¿Quora alguna vez se volverá consciente de sí mismo, dada su gran reserva de conocimiento?

¿Por qué la minimización de la divergencia de KL ayuda en la convergencia de algoritmos de aprendizaje automático?

¿Qué tipos de algoritmos de aprendizaje automático son buenos para aprender representación? ¿Es solo aprendizaje profundo?

¿Cuáles son los conocimientos preliminares sobre DDN o el aprendizaje automático?

¿Por qué el CSAIL del MIT no es más fuerte para estudiar IA?

Como estudiante de CS, ¿qué me estoy perdiendo si no tomo un curso sobre SO y compiladores?

¿Cuáles son algunos métodos para etiquetar datos de entrenamiento para una red neuronal?

¿Cuál es la esperanza de vida de la IA?