14 de marzo actualización:
Ahora se vuelve más y más interesante.
Después del Juego 2, la mayoría de la gente piensa que Lee (o incluso los seres humanos) no iba a tener la oportunidad de ganarse a alphaGo. El Juego 3 de AlphaGo refuerza este argumento.
- ¿Qué son las tecnologías de código abierto?
- ¿Cómo se puede utilizar la realidad aumentada en la educación?
- ¿Cuál es la mejor manera de viajar a Marte con tecnología moderna?
- ¿Cuál es el texto pixelado que ocasionalmente aparece en la parte superior de las historias de Snapchat?
- ¿Cómo funcionó el show de drones del Super Bowl 51?
Sin embargo, ¡Lee ganó el Juego 4 explotando una debilidad de AlphaGo! Básicamente, su movimiento 78 no fue visto por la red de valor de AlphaGo (predecir qué tan probable será ganar, una visión más global del juego). Dado que la red de valor se formó a partir de juegos históricos de expertos humanos, los datos de entrenamiento son muy limitados en comparación con los utilizados por la red de políticas (tiene más datos al hacer el aprendizaje de refuerzo del juego propio). Esto esencialmente causó el sobreajuste y AlphaGo no se dio cuenta de su tasa de victorias hasta el movimiento 87.
Entonces, parece que hay una manera de ganar AlphaGo para Lee Se-dol en esta serie (aunque solo queda un juego).
- Evite la lucha local siempre que sea posible (los humanos no pueden vencer a la red política que puede prever muchos más pasos que los humanos en una lucha local).
- Aumenta el número de batalla lo más posible al mismo tiempo. Esto provoca más cómputo y AlphaGo tiene que hacer más políticas de implementación de tiempo de ejecución, que es mucho menos potente debido a la limitación de tiempo.
- Intenta evitar cualquier movimiento que se haya jugado antes.
En resumen, atacar la red de valor de AlphaGo que se basa en un conjunto de entrenamiento limitado (juegos contables de expertos humanos).
¡Veamos si Lee puede ganar el Juego 5 o no!
——————————–
9 de marzo actualización:
- El consenso es que la gente ve una gran mejora en los últimos meses desde el último juego con Fan Hui.
- Un jugador de 9 Dan Go en China dijo que alphaGo ha demostrado al menos una habilidad de 5-6 Dan.
- El juego de esta noche será crucial. Si Lee Se-dol vuelve a perder, no hay posibilidad de que los jugadores humanos puedan desafiar a alphaGo nunca más, dada la velocidad de aprendizaje de AlphaGo.
——————————–
Lee solo necesita asegurarse de no cometer errores en el nivel de táctica.
Un amigo mío que es aficionado a Go Amateur me dijo que la última actuación de AlphaGo no está cerca del nivel de 9 Dan. La última vez que ganó fue principalmente capturar piedras con éxito, y fue un avance táctico debido a su súper poder de cálculo y sin errores tontos. Pero no hemos observado el pensamiento estratégico de AlphaGo, que es una medida clave para el jugador de 9 Dan.
En el mundo profesional de Go, calcular peleas locales es una habilidad básica para un jugador profesional, sin mencionar a 9 jugadores de Dan como Lee.
Así que creo que mientras Lee no se equivoque en su cálculo local, esta vez no debería tener problemas para ganar Deepmind.