En el caso Lee vs AlphaGo, creo que aumentar los límites de tiempo a una extensión razonable (como duplicar o triplicar, pero no hacerlo por 1 mes) favorecería a Lee.
La ventaja y la escasez de AG fueron obvias en el primer partido: funcionó excepcionalmente bien en tácticas pero aún era muy pobre en estrategia. Lee obtuvo una gran ventaja de los movimientos de AG de # 42, # 48 y # 80, que fueron los mejores movimientos en el área local, pero tuvieron poco valor para la situación general de la junta. Sin embargo, la ventaja de Lee se revirtió cuando cometió varios errores al luchar en la esquina inferior derecha y en la esquina superior derecha, cuando se determinó la situación general y cada área pequeña era independiente de las demás.
Esto, creo, significa que DeepMind no es realmente tan profundo: AG tiene la capacidad de encontrar el mejor movimiento en una cuadrícula pequeña (como 12 × 12) pero no puede evaluar el valor de un movimiento en una situación de tablero completo. Su red de políticas es mejor que un jugador humano de 9 dan pero su red de valor está por debajo de cualquier pro dan.
- ¿Qué startups de IA parecen estar teniendo éxito?
- ¿Qué país tiene la tecnología robótica más avanzada?
- ¿Cuáles son las armas más letales que se pueden usar en un robot para una competencia de Robowars?
- ¿Wikipedia tiene la intención de seguir el liderazgo de organizaciones como Facebook e Instagram en el uso de inteligencia artificial para eliminar los comentarios de acoso?
- ¿Qué impide que un sistema de aprendizaje automático aprenda su propia salida de jugar contra sí mismo y llegar muy por delante de otros motores de ajedrez?
La complejidad del cálculo crece en orden exponencial según el tamaño de la cuadrícula. Entonces, si se le da a AG un doble tiempo, la mejora de la capacidad de la estrategia es menor. La mejora en las tácticas también es pequeña porque ya lo estaba haciendo casi perfecto.
Por el contrario, duplicar el tiempo permitido reduciría en gran medida la posibilidad de que Lee cometa errores.
En términos generales, evaluaría a ambos jugadores de la siguiente manera:
capacidad total = capacidad de estrategia + mejor capacidad táctica * (1 – posibilidad de error)
Para Lee, es 90 + 90 * 50% = 135
Para AG, es 50 + 95 * 100 = 145
Con doble tiempo, serían:
Lee: 90 + 90 * 70% = 153
AG: 55 + 95 * 100 = 145 = 150