¿Existen las redes neuronales de Markov?

Hola,

Eche un vistazo al paradigma de Reservoir Computing, y especialmente a Echo State Networks (ESN).

Básicamente, los ESN son redes neuronales recurrentes (RNN) con pequeños pesos aleatorizados en la parte recurrente / dinámica. Se ha demostrado que esto restringe la dinámica de la red hacia una organización espacial estatal de Markovian (basada en sufijos).
Más sobre esto se puede encontrar en:

Tino, Peter, Michal Cernansky y Lubica Benuskova. “Sesgo arquitectónico markoviano de redes neuronales recurrentes”. Transacciones IEEE en redes neuronales 15.1 (2004): 6-15.

Gallicchio, Claudio y Alessio Micheli. “Factores arquitectónicos y markovianos de las redes de estado de eco”. Redes neuronales 24.5 (2011): 440-456.

Además, recientemente se introdujo / analizó una extensión del paradigma RC en la dirección del aprendizaje profundo en

Gallicchio, Claudio, Alessio Micheli y Luca Pedrelli. “Computación de yacimientos profundos: un análisis experimental crítico”. Neurocomputación (2017).

y

Gallicchio, Claudio y Alessio Micheli. “Propiedad del estado eco de las redes de computación de embalses profundos”. Computación cognitiva (2017): 1-14.

Saludos 🙂

Nunca he oído hablar de uno. Eso es todo lo que puedo decirte con seguridad.

Sin embargo, no sería demasiado difícil de hacer.

Inicialice todos los pesos a valores positivos y normalice las filas según sus normas L1.

Para las actualizaciones de peso, toma el gradiente como de costumbre y luego lo proyecta en el hiperplano [math] \ sum w_i = 1 [/ math] antes de multiplicar por la tasa de aprendizaje. Luego, si aumentara el peso por encima de 1 o por debajo de 0, reduzca la escala hasta que ya no lo haga. alternativamente, puede proyectarlo en el hiperplano de dimensión inferior que excluye aquellos pesos que irían fuera de [math] [0,1] [/ math].

Imponer restricciones a los pesos no es difícil, pero hace que la optimización sea mucho más difícil porque es fácil quedarse atascado en los mínimos locales a lo largo del límite de la región restringida.

En cuanto a las capas repetidas, eso es muy común y fácil de hacer. No hay inconvenientes importantes allí.

La verdadera pregunta es ” ¿por qué? “. Es un pensamiento interesante, pero ¿qué problema resuelve? Pude ver que la restricción de peso es útil para normalizar las características de la red media, pero hace que la optimización sea mucho más difícil que esperaría que los métodos de normalización habituales como la normalización por lotes sean más útiles.

Creo que puede imponer esas restricciones a los pesos de una red neuronal, pero apenas puedo imaginar un propósito.

También puede probar una capa softmax cuyas activaciones se suman a 1 y todas son positivas. Es totalmente posible apilarlos.

More Interesting

¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

¿Cuál es la diferencia entre traducción automática y memoria de traducción?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2016?

¿Es interesante trabajar con AI en un nivel bajo?

¿Qué debo elegir para estudiar, aprendizaje automático, análisis de big data o algo más en inteligencia artificial?

¿Por qué Apple ha adoptado una estrategia de privacidad diferencial en torno a la IA y los datos del usuario, pero Google no?

¿Cómo agrega la función de activación la no linealidad a las redes neuronales?

Cómo dar sentido a estar vivo

Después de terminar el curso de aprendizaje automático en Coursera. ¿Qué tengo que hacer? ¿Curso de inteligencia artificial sobre edx o tutoriales de aprendizaje profundo?

¿Cuál es la relación entre la inteligencia artificial y el aprendizaje automático?

¿Cuáles son los mejores proyectos en tiempo real sobre regresión en el dominio del aprendizaje automático?

¿Cuáles son algunos ejemplos de 'ideas de bot de chat' que podrían cambiar mucho el mundo?

¿Cómo se aplica la inteligencia artificial a los sistemas de transmisión automática en automóviles?

¿Es mejor codificar un chatbot usted mismo o usar un servicio como Hyphen AI?

¿Cuáles son las nuevas áreas de investigación en aprendizaje automático especialmente relacionadas con la analítica y la minería de datos?