AlphaGo vs Lee Sedol: ¿Quién gana y cuál será el puntaje final? ¿Por qué piensas eso?

Después del juego final el 3.15.16, AlphaGo ganó 4: 1 contra Lee Sedol 9p. Lee pudo jugar fiel a su estilo y habilidades en el quinto partido, y desafortunadamente, la precisión de AlphaGo como calculadora al final del juego llevó a su victoria. Este no fue un resultado realmente sorprendente, considerando los juegos fuertes mostrados por AlphaGo en los primeros cuatro partidos. Me gustaría felicitar a Lee Sedol 9p por ganar un partido, ya que habría sido extremadamente estresante ir en contra de las habilidades de las CPU de 1920.

Esto fue irónicamente lo contrario de lo que Lee Sedol predijo antes de que comenzara el partido, pero considerando que AlphaGo es un 9p honorario ahora, creo que veremos más partidos entre ellos. AlphaGo y jugadores de clase mundial. Como el partido entró en conflicto con los campeonatos mundiales de Go, fue una batalla solitaria para Lee (muchos profesionales competían en China), y fue sorprendente ver su victoria (el blanco 78 fue crucial).

Lee Sedol 3 AlphaGo 2 : a pesar de todas las cosas de aprendizaje profundo que se usan en AlphaGo, siento que carece de la experiencia general que ayuda a ganar. Go es un juego complejo y la oportunidad y la experiencia pueden entrar en juego. El cerebro humano puede codificar esa experiencia de una mejor manera que los métodos actuales de aprendizaje profundo.

Pero será un juego difícil, si AlphaGo gana, entonces la puntuación probablemente sea Lee Sedol 2 AlphaGo 3. Esto se debe a que si los dos coinciden, existe la posibilidad de que el margen no sea grande.

Espero que esto ayude.

Predije 4: 1 o 5: 0 a favor de AlphaGo antes del primer partido. Según el primer partido, estoy bastante seguro de que se me dará la razón.

Aquí está lo que escribí en otro sitio,

Creo que la gente está subestimando enormemente AlphaGo

1) Google puede arrojar más recursos: cada duplicación de la potencia de la computadora es de aproximadamente 60 Elo. Un aumento de 80 veces en la potencia informática debería ser Lee Sedol sin ninguna mejora algorítmica.

2) Han tenido 6 meses para mejorar el algoritmo; probablemente había MUCHA fruta baja para mejorar

3) El conjunto de datos de entrenamiento que usaron era bastante pequeño: probablemente tenían 100 veces más datos de entrenamiento disponibles sin un riesgo real de sesgo. Con un aumento en los datos, probablemente obtendrán un juego mucho más fuerte.

4) Los controles de tiempo son más largos esta vez, lo que permitirá que la computadora busque mucha más profundidad.

Entonces predeciré que AlphaGo gana 4-1.