Deep Q Networks (DeepMind) combina la estructura jerárquica del cerebro con el mecanismo de aprendizaje biológicamente más sólido. El aprendizaje de refuerzo se basa en las ciencias del comportamiento y hemos encontrado correlaciones matemáticas sólidas entre la predicción de recompensas y los patrones de liberación de dopamina.
Creo que nos acercaremos al funcionamiento biológico del cerebro combinando esta arquitectura con neuronas realistas: neuronas que se disparan en lugar de perceptrones estándar. En realidad, tenemos modelos muy detallados, como el Hodgkin-Huxley, pero otras simulaciones son más o menos equivalentes y permitirán el procesamiento en tiempo real.
Además, conecte algún mecanismo de memoria, como LSTM.
- Inteligencia artificial: ¿Qué es el entrenamiento previo capa por capa en el aprendizaje no supervisado?
- ¿Qué tan efectivo y fácil es usar Octave para el aprendizaje automático?
- ¿Cuál es la aplicación del aprendizaje automático en contabilidad / auditoría / impuestos y finanzas corporativas?
- ¿Cuál es la diferencia entre un chatbot y un asistente personal inteligente?
- ¿Qué papel tendrá la IA en el enfoque de diseño de IDEO?
Estoy dispuesto a probar esto en el futuro (Deep-Q-Nets + Spiking neuronas) y tengo algunas hipótesis interesantes que vinculan la neurofisiología / drogas deterioradas y el comportamiento psicótico.
Sin embargo, es una posibilidad remota. No tengo colegas que trabajen en IA de vanguardia, por lo que requeriría mucho esfuerzo individual (= tiempo) para hacerlo solo y tengo facturas que pagar 🙁
Además, estos no son juguetes plug and play y esta integración puede ser mucho más compleja de lo que la respuesta sugiere.
¿Alguien en Quora para el desafío?
Deep Q Net: devsisters / DQN-tensorflow
Ya es posible propagar hacia atrás las redes de espiga profunda: formación de redes neuronales de espiga profunda mediante propagación inversa
La tarea es implementar redes Q profundas con neuronas en aumento.