¿Qué tan fácil es aprender una función booleana con Descenso de gradiente usando un aprendizaje profundo?

No, no hay problema en absoluto. Tampoco necesita una red neuronal profunda (una capa oculta es suficiente) y un método de descenso de gradiente real (la propagación beck hace el trabajo). Recuerde que las neuronas en la entrada y las capas ocultas tienen funciones sigmoideas no lineales. Las ganancias y los sesgos conducirán después de suficiente entrenamiento con 0s y 1s a la orientación correcta y suficiente saturación para hacer que la computación de la salida sea perfectamente binaria. Si no sobredimensiona la red, utilizando tantas neuronas y capas como necesite, incluso puede proporcionarle a una red tan capacitada un conjunto de entradas difusas, donde las premisas están en algún lugar entre 0 y 1 y bingo, obtiene salidas difusas en ¡Un sistema de inferencia de lógica borrosa!

Si sobredimensionas la red, obtienes ondas y estás condenado a la muerte eterna al usar mal una palabra de moda en ingeniería.

En caso de regresión logística, no es para nada “extraño”.

Hay un conjunto de predictores con objetivo binario y debe descubrir un límite de decisión. Si elige su función de costo con respecto al gradiente, puede facilitar el proceso de optimización. Sucede para que una función sigmoidea emparejada con entropía cruzada satisfaga esta propiedad.

Cuando tiene una arquitectura más profunda o más profunda, puede pensar en la última capa como una regresión logística donde la entrada es proporcionada por las capas anteriores.

Y sí, hay problemas. Si sus gradientes, en las capas superiores, no tienen una propiedad ‘agradable’, entonces la convergencia es lenta, si es que tiene alguna.

More Interesting

¿Qué es el Autoencoder Adversarial?

¿Cuáles son las probabilidades de ingresar a un programa de posgrado de aprendizaje automático en una escuela superior si mi experiencia en investigación es en bioinformática y algo de experiencia en investigación en PNL?

¿Cuáles son los beneficios de convertir una capa totalmente conectada en una red neuronal profunda a una capa convolucional equivalente?

¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?

¿Podemos nombrar funciones de funciones en CRF como funciones de kernel como para SMV?

¿Podría el aprendizaje automático erradicar el cáncer?

Cómo construir un horario usando un algoritmo genético

¿Cuáles son los algoritmos más populares utilizados en redes neuronales convolucionales?

¿Por qué Apple no equipa sus máquinas con mejores opciones de tarjeta de video?

¿Alguien puede resolver este ejemplo de algoritmo EM?

¿Cuántos datos necesitamos para pensar siquiera en aplicar el aprendizaje profundo?

¿Es posible generar datos de expresión genética artificial? Las imágenes a veces se pueden perturbar para aumentar el tamaño de las muestras con fines de aprendizaje automático.

¿Cómo reconoce la red neuronal convolucional los objetos de las imágenes sin la percepción o reconocimiento 3D?

¿Se pueden mezclar variables categóricas y continuas en una red neuronal simple?

Cómo proceder si no puedo desempeñarme mejor en un conjunto de datos en particular cuando intento ajustar un modelo de aprendizaje automático