¿Cómo una red neuronal artificial calcula su salida?

La parte de avance es fácil:
Tomamos muchas sumas ponderadas de manera diferente del vector de entrada, las “aplastamos” y hacemos que cada una de estas sumas aplastadas active una unidad oculta diferente.
Luego tomamos diferentes sumas ponderadas de unidades ocultas (y las aplastamos) para obtener las unidades de salida.

Elaborar:
Toma el vector de entrada x
Ahora, para cada unidad oculta i, de n unidades ocultas, tome el producto punto del vector de entrada con los pesos de la unidad oculta h_i (es decir, sum_k h_ik * x_k, siendo k el índice de los vectores). Tome esta puntuación z_i y “aplaste” entre 0 y 1 (o -1 y 1) con lo que se llama una función sigmoidea (por ejemplo, la función logística f (z) = 1 / (1 + exp ^ -z)

Ahora, cada unidad oculta tiene una activación entre 0 y 1, llamaremos a esto o_i.

Ahora, hacemos lo mismo que hicimos antes con la entrada original, excepto que lo hacemos con el conjunto de o_i, usando los vectores de peso w_p para todos los m nodos de salida (que podrían representar, por ejemplo, las m clases que podríamos querer clasificar una entrada en).

En el caso de la clasificación binaria, tomaríamos una sola suma ponderada de nuestras unidades ocultas y ni siquiera tendríamos que aplastarla.

More Interesting

¿Necesita saber la teoría de la medida para hacer investigación de aprendizaje automático?

¿Cuál es el mejor tutorial de Python para el aprendizaje automático?

¿Cuáles son las ventajas y desventajas de utilizar PMML como formato de intercambio para modelos de análisis predictivo?

¿Cuál es la diferencia entre SVM y ANN?

¿Qué significa 'regresión' en estadística y aprendizaje automático?

¿Cuáles son los últimos algoritmos de aprendizaje de los vecinos más cercanos? Me refiero a todo lo que se basa en datos, como métodos basados ​​en instancias, kNN, algoritmos de aprendizaje vecinos y métricos, todo en un solo lugar.

¿Una máquina aprende una ciencia o un arte?

¿Qué papel jugará la ciencia de datos en las elecciones presidenciales de 2012?

¿En qué se diferencia el aprendizaje automático de la minería de datos?

¿Por qué muchos estudios de investigación afirman que el aprendizaje profundo es una caja negra?

¿Qué debo leer para desarrollar un rastreador web que raspe un subconjunto de Internet y me brinde los enlaces de los sitios web que son tiendas de abarrotes?

¿Cuáles son algunas áreas de investigación en la intersección del aprendizaje automático y las criptomonedas?

¿A qué se refiere el concepto de sesgo de presentación-retroalimentación en el contexto del aprendizaje automático?

¿Cómo debo comenzar a escribir una IA que jugará FIFA?

¿Cuáles son las aplicaciones no computacionales de las lecciones del aprendizaje automático?