Podría ser posible crear una buena máquina (no imbatible), con suficientes datos limpios de múltiples jugadores (probablemente el mismo mazo) frente a múltiples mazos diferentes, máquina optimizada mediante aprendizaje de transferencia (ImageNet) y LSTM. No estoy seguro de si el aprendizaje de transferencia funciona mejor que el entrenamiento scratch en los marcos.
Esta máquina sería un buen punto de partida. Entonces la máquina puede generar más datos al “jugar”, y aprender algo cuando ha cometido un error. Por lo tanto, la máquina se volvería a entrenar con nuevos datos periódicamente. Principal inconveniente, el enfoque que menciono requiere volver a entrenar toda la red desde cero.
Esto supone que no hay otra información, pero el video está disponible. Probablemente, la información de coordenadas del tablero en cada punto dado (cuadros) contendría información más robusta que las características extraídas mediante el aprendizaje de transferencia.
- ¿Qué es un proyecto paralelo fácil pero divertido de la vida real basado en algoritmos genéticos?
- ¿Por qué no evolucionó Skynet?
- ¿Cuál es el algoritmo detrás de x.ai?
- ¿Alguna vez llegaremos a los puntos donde los videojuegos pueden responder a las entradas del lenguaje natural?
- ¿Alguien puede guiarme sobre cómo mejorar mi interés en Inteligencia Artificial y Robótica?
Otro enfoque sería utilizar el aprendizaje por refuerzo y un buen conjunto de “mazos más comunes”. Similar a Alpha Go Zero.
Aclamaciones,
EM