Andrew Ng: ¿Qué opinas de AlphaGo?

AlphaGo es un programa que se basa en métodos de IA de uso general, que utiliza redes neuronales profundas para imitar jugadores expertos. Estas redes neuronales toman una descripción de la placa Go como entrada y la procesan a través de 12 capas de red diferentes que contienen millones de conexiones similares a las neuronas Una red neuronal, “red política”, selecciona el próximo movimiento para jugar. La otra red neuronal, “red de valor”, predice el ganador del juego. Las redes neuronales se entrenan en 30 millones de movimientos de juegos jugados por expertos humanos, hasta que podría predecir el movimiento humano el 57% del tiempo. El objetivo de AlphaGo es vencer a los mejores jugadores humanos y no solo imitarlos. Para hacer esto, AlphaGo aprendió a descubrir nuevas estrategias por sí mismo, jugando miles de juegos entre sus redes neuronales y ajustando las conexiones mediante un proceso de prueba y error conocido como aprendizaje de refuerzo. Después de todo ese entrenamiento, AlphaGo estaba listo para probar. Primero se llevó a cabo un torneo entre AlphaGo y otros programas principales al frente de Computer Go. AlphaGo ganó todos menos uno de sus 500 juegos contra estos programas. Así que el siguiente paso fue invitar al tres veces campeón europeo de Go Fan Hui (un jugador profesional de élite que ha dedicado su vida al Go desde los 12 años) para un partido de desafío y, sorprendentemente, AlphaGo ganó por 5 juegos a 0. Fue el primera vez que un programa de computadora ha vencido a un jugador profesional de Go.