¿Cómo funciona la hipótesis para una red neuronal simple (MLP con activación logística, salida única) en forma simplificada?

Cada función opera en la salida de la capa de abajo. Entonces, una red de 4 capas tiene 3 transformaciones (excluyendo la capa de entrada que es solo el vector de entrada)

[matemáticas] f_3 (w_3, f_2 (w_2, f_1 (w_1, x_1))) [/ matemáticas]

Donde [math] x [/ math] es un vector 4 dimensional * (en su caso), [math] w [/ math] = matriz de parámetros y [math] f [/ math] = cualquier función de activación.

* En la práctica, la entrada de polarización de [math] 1 [/ math] normalmente se agrega al vector de entrada. Entonces, para un vector tridimensional [matemática] x = [x_1, x_2, x_3] ^ {T} [/ matemática] se obtiene un vector tridimensional [matemática] x = [x_1, x_2, x_3,1] ^ {T} [/matemáticas]

EDITAR: Lo pediste, Zachary Nagler 🙂

Gracias. Ayuda, pero me pregunto cómo se vería esto en forma expandida, incluida la función logística. Puede ser demasiado grande para escribir con 2 capas ocultas, pero debería ser factible con 1. Al final del día, todo se reduce a la aritmética elemental de todos los pesos y entradas, así que me pregunto cómo se vería. en esa forma

Para 1 capa oculta tenemos dos transformaciones

[matemáticas] f (w_2, w_1, b_2, b_1, x) = \ frac {1} {1 + e ^ {- w_2 * {\ frac {1} {1 + e ^ {- w_1 * x – b_1}} } – b_2}} [/ matemáticas]

Donde b = sesgo. Entonces un 1 no se agrega a la x en este caso. Entonces [matemáticas] x = [x_1, x_2, x_3] ^ {T} [/ matemáticas]

Espero que esto ayude.

Aprendizaje automáticoArtificialInteligenciaRedes neuronales artificiales

Related Content

¿Cómo se puede aplicar OpenCyc o ResearchCyc al archivo histórico de Twitter?

¿Cuál es la mejor inversión AI o sostenibilidad?

Si fuera posible construir un hardware de IA con la misma cantidad de neuronas artificiales y sinapsis que el cerebro humano, ¿sería esta máquina más inteligente que una persona ya que los circuitos electrónicos funcionan mucho más rápido que la transmisión de neuronas?

¿Cuáles son los problemas más interesantes en los que OpenAI está trabajando?

Al entrenar una red neuronal, ¿tengo que entrenar a la red con la salida correcta para cada entrada posible?

¿Hay alguna forma de que la IA entienda el sarcasmo?

¿El aprendizaje por refuerzo es el primer paso para la IA general?

More Interesting

¿Qué piensan los neurocientíficos de las redes neuronales computacionales y el aprendizaje profundo?

Cómo clasificar si un artículo de noticias es falso o real utilizando el aprendizaje automático

En términos simples, ¿cuál es la singularidad tecnológica?

¿Qué papel juega la epistemología en la inteligencia artificial?

¿Cuáles son las principales aplicaciones / juegos móviles de Android / iOS que utilizan ampliamente la inteligencia artificial?

¿Qué porcentaje de trabajos serán reemplazados por IA y robots?

Si el software fuera tan inteligente como nosotros, ¿en qué entorno funcionaría?

¿Por qué los investigadores de IA no desarrollan más "sistemas expertos"?

¿Qué adiciones o cambios harías a las tres leyes de la robótica?

¿Los jugadores de ajedrez tienen diferentes estilos?

¿Cómo funcionan exactamente los robots controlados por la mente?

¿Es el aprendizaje profundo 'IA real'?

¿Qué es el muestreo de control de casos? ¿Cuándo se usa en el aprendizaje automático?

¿Cuáles son las redes de aprendizaje profundo óptimas para una solución de 'caja negra' como sea posible que se puede ejecutar en modo por lotes?

Quiero escribir un trabajo de investigación sobre inteligencia artificial, ¿qué debo hacer para comenzar?

Web Analytics