¿Existen las redes neuronales de Markov?

Hola,

Eche un vistazo al paradigma de Reservoir Computing, y especialmente a Echo State Networks (ESN).

Básicamente, los ESN son redes neuronales recurrentes (RNN) con pequeños pesos aleatorizados en la parte recurrente / dinámica. Se ha demostrado que esto restringe la dinámica de la red hacia una organización espacial estatal de Markovian (basada en sufijos).
Más sobre esto se puede encontrar en:

¿Cuál es la diferencia entre inteligencia artificial y algoritmos?
¿Por qué debería aprender técnicas de aprendizaje profundo?
¿Los sistemas de reconocimiento de imágenes de aprendizaje profundo siempre aprenden esencialmente las mismas características de bajo nivel?
¿Qué algoritmos de minería de datos / reconocimiento de patrones toman los datos como entrada y luego generan modelos / fórmulas matemáticas?
Cómo obtener una inteligencia artificial para ejecutar mi startup

Tino, Peter, Michal Cernansky y Lubica Benuskova. “Sesgo arquitectónico markoviano de redes neuronales recurrentes”. Transacciones IEEE en redes neuronales 15.1 (2004): 6-15.

Gallicchio, Claudio y Alessio Micheli. “Factores arquitectónicos y markovianos de las redes de estado de eco”. Redes neuronales 24.5 (2011): 440-456.

Además, recientemente se introdujo / analizó una extensión del paradigma RC en la dirección del aprendizaje profundo en

Gallicchio, Claudio, Alessio Micheli y Luca Pedrelli. “Computación de yacimientos profundos: un análisis experimental crítico”. Neurocomputación (2017).

y

Gallicchio, Claudio y Alessio Micheli. “Propiedad del estado eco de las redes de computación de embalses profundos”. Computación cognitiva (2017): 1-14.

Saludos 🙂

Aprendizaje automáticoAprendizaje profundoInteligencia ArtificialRedes neuronales artificiales

Related Content

Cómo proceder para hacer una carrera en inteligencia artificial después de mi duodécimo estándar

Cómo conectarme con otras personas para trabajar en IA, ML y PNL para ampliar aún más mis habilidades

¿Cuáles son algunos de los principales problemas no resueltos en el aprendizaje automático?

¿Por qué la búsqueda A * se llama búsqueda A *?

¿Qué es lo que los humanos valoran que, incluso si los robots pueden hacer, podría no ser atractivo para los humanos?

¿Sería justo decir que todos los algoritmos de aprendizaje automático se generalizan a un puñado de principios básicos de aprendizaje?

¿Qué es el sensor? ¿Como funciona?

Nunca he oído hablar de uno. Eso es todo lo que puedo decirte con seguridad.

Sin embargo, no sería demasiado difícil de hacer.

Inicialice todos los pesos a valores positivos y normalice las filas según sus normas L1.

Para las actualizaciones de peso, toma el gradiente como de costumbre y luego lo proyecta en el hiperplano [math] \ sum w_i = 1 [/ math] antes de multiplicar por la tasa de aprendizaje. Luego, si aumentara el peso por encima de 1 o por debajo de 0, reduzca la escala hasta que ya no lo haga. alternativamente, puede proyectarlo en el hiperplano de dimensión inferior que excluye aquellos pesos que irían fuera de [math] [0,1] [/ math].

Imponer restricciones a los pesos no es difícil, pero hace que la optimización sea mucho más difícil porque es fácil quedarse atascado en los mínimos locales a lo largo del límite de la región restringida.

En cuanto a las capas repetidas, eso es muy común y fácil de hacer. No hay inconvenientes importantes allí.

La verdadera pregunta es ” ¿por qué? “. Es un pensamiento interesante, pero ¿qué problema resuelve? Pude ver que la restricción de peso es útil para normalizar las características de la red media, pero hace que la optimización sea mucho más difícil que esperaría que los métodos de normalización habituales como la normalización por lotes sean más útiles.

Gallicios

Creo que puede imponer esas restricciones a los pesos de una red neuronal, pero apenas puedo imaginar un propósito.

También puede probar una capa softmax cuyas activaciones se suman a 1 y todas son positivas. Es totalmente posible apilarlos.

Egor Dezhic

More Interesting

¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

¿Cuál es la diferencia entre traducción automática y memoria de traducción?

¿Cuáles fueron los 10 problemas principales en Machine Learning para 2016?

¿Es interesante trabajar con AI en un nivel bajo?

¿Qué debo elegir para estudiar, aprendizaje automático, análisis de big data o algo más en inteligencia artificial?

¿Por qué Apple ha adoptado una estrategia de privacidad diferencial en torno a la IA y los datos del usuario, pero Google no?

¿Cómo agrega la función de activación la no linealidad a las redes neuronales?

Cómo dar sentido a estar vivo

Después de terminar el curso de aprendizaje automático en Coursera. ¿Qué tengo que hacer? ¿Curso de inteligencia artificial sobre edx o tutoriales de aprendizaje profundo?

¿Cuál es la relación entre la inteligencia artificial y el aprendizaje automático?

¿Cuáles son los mejores proyectos en tiempo real sobre regresión en el dominio del aprendizaje automático?

¿Cuáles son algunos ejemplos de 'ideas de bot de chat' que podrían cambiar mucho el mundo?

¿Cómo se aplica la inteligencia artificial a los sistemas de transmisión automática en automóviles?

¿Es mejor codificar un chatbot usted mismo o usar un servicio como Hyphen AI?

¿Cuáles son las nuevas áreas de investigación en aprendizaje automático especialmente relacionadas con la analítica y la minería de datos?

Web Analytics