De hecho, Matthew Lai, que ahora forma parte de Google DeepMind, y probablemente participó en el proyecto AlphaGo, hizo exactamente eso para su tesis de maestría:
http://arxiv.org/pdf/1509.01549v…
Sin embargo, la forma en que se plantea la pregunta anterior hace que parezca algo trivial. En juegos con grandes espacios de configuración, puede ser imposible simular e iterar sobre todas las configuraciones posibles en un tiempo finito / razonable incluso con grandes grupos de computadoras. Además, diseñar una arquitectura de modelo (aprendizaje automático) que pueda abstraerse del estado exacto del tablero y aprender algunas “ideas” generalmente aplicables puede ser muy desafiante, a diferencia de una memoria asociativa que solo recupera un tablero visto anteriormente. estado. No se puede lograr tal generalización con un algoritmo de aprendizaje de recuadro negro.
- En una escala de 0-10, ¿cuánto conocimiento de aprendizaje profundo obtendrá después de completar la especialización deeplearning.ai?
- ¿Hay alguna forma, método o plan para poder controlar una IA superinteligente?
- ¿Existe una diferencia significativa entre un cerebro humano y una red neuronal simulada?
- ¿Cuáles son algunos buenos ejemplos de IA benévola en ciencia ficción?
- ¿Qué debe leer un investigador de IA para aprender neurociencia?
Incluso Alpha-Go no solo utiliza el aprendizaje automático: funciona combinando la búsqueda de árbol de fuerza bruta con una aproximación basada en el aprendizaje automático (altamente diseñada) que adivina más allá de las profundidades de los árboles que no son factibles de búsqueda.