Cómo calcular un proceso de red neuronal artificial

Una capa de una red neuronal no es más que la multiplicación de matriz-vector con una función no lineal de algún tipo aplicada a la salida. Existen varias funciones estándar no lineales llamadas “funciones de activación”, que incluyen ReLU, sigmoide / logística y tanh.

Para hacer la propagación hacia atrás, utilice el cálculo para calcular la tasa de cambio de los nodos en una capa con respecto a un nodo en la capa anterior. Luego, solo use el algoritmo de optimización de su elección para actualizar los pesos para entrenar.

Eso es. Es realmente así de simple. De eso se trata todo este bombo publicitario. Bueno, no del todo. La exageración se trata de redes neuronales convolucionales más ReLU con una red neuronal estándar en el extremo. Realmente no entiendo el bombo, ya que las CNN han existido desde Yann LeCun en los años 90.

Recientemente, introdujeron un truco llamado conexiones de omisión donde omiten capas. (Lo descubrí hace 15 años y estaba entrenando redes neuronales en tiempo real que tenían un comportamiento casi realista).

Hay algunos trucos y variaciones más. (Bien, eso es un eufemismo. Hay cientos de variaciones). Pero todas se basan en la simple idea de una multiplicación ay sumatoria seguida de una función no lineal.

Aprendizaje automáticoArtificialInteligenciaRedes neuronales artificiales

Related Content

¿Qué puede ayudar a averiguar si una función de pérdida es sensible al ruido o no?

¿Es posible verificar manualmente si los vectores de soporte siguen hiperplanos teóricos en SVM usando un núcleo de base radial?

¿Cuáles son las diferencias, similitudes, pros, contras, aplicaciones y descripciones de Keras, TensorFlow, Theano?

¿Qué significa que las funciones de activación (como ReLU) en NN inducen la escasez en las unidades ocultas?

Serie temporal: ¿Existe un enfoque para la detección de anomalías que no se base en datos de entrenamiento anteriores?

¿Cuáles son los trabajos más gratificantes para quienes desean trabajar en el aprendizaje profundo?

Cómo terminar mi compilación con i7-7700k y GTX 1070 por 1000 $

Espero que esto ayude: comprender los fundamentos de las redes neuronales

Egor Dezhic

More Interesting

Cómo aprender a convertirse en un experto en aprendizaje profundo

¿Cuál es la diferencia entre la taxonomía automática y la generación de clasificación?

¿Por qué el aprendizaje del 'lenguaje ensamblador y máquina' se enfatiza menos en las universidades en comparación con el aprendizaje de lenguajes de programación generales?

¿Cómo es ser aconsejado por Sunita Sarawagi?

¿Hay un equivalente a Rosalind en el aprendizaje automático?

¿TF-IDF está categorizado como una selección de características o una extracción de características?

¿Por qué se le da tanta atención a xgboost que al aprendizaje profundo a pesar de su ubicuidad en ganar soluciones de Kaggle?

¿Qué hará Keras con TensorFlow-Slim?

¿Por qué alguien usaría un modelo de regresión basado en un árbol de decisión?

Procesamiento del lenguaje natural: ¿Cuáles son algunas ideas de problemas / proyectos sobre la clasificación jerárquica de textos?

Si la IA de aprendizaje automático no puede explicar una respuesta, ¿se puede 'confiar' en un diagnóstico médico?

¿Por qué la función de activación de softmax se llama "softmax"?

¿Debería Facebook usar el aprendizaje automático para identificar a los usuarios con potencial de convertirse en un asesino en masa?

¿Es legal el raspado web para hacer aprendizaje automático?

¿Cuál es una mejor manera de comenzar a aprender Ciencia de Datos, a través de cursos en línea o en un Instituto de capacitación?

Web Analytics