¿Cómo se codifica algo como AlphaGo de Google DeepMind? ¿Cuántas líneas de código se utilizan para construir un programa tan avanzado?

Ahora, no soy un experto, así que corrígeme si me equivoco sobre algo, pero sé un poco sobre esto.

No sigue el método de fuerza bruta (analizando todas las posibilidades) debido a la gran cantidad de posibilidades en Go, sino que se basa en una combinación de dos cosas junto con Machine Learning.

  • Búsqueda de árbol de Monte Carlo: implica elegir movimientos al azar
    luego simulando el juego hasta el final para encontrar una estrategia ganadora.
  • Redes neuronales profundas: una red de 12 capas de conexiones neuronales
    que consiste en una red que selecciona el siguiente movimiento y un
    red que predice el ganador del juego.

Un punto peculiar de AlphaGo es que, en lugar de tener movimientos “buenos” y “malos”, estudió una cantidad increíblemente grande de partidos de Go. Y utilizando el aprendizaje profundo logró un estado en el que ganaría la mayoría de sus partidos

Ahora, lo que esto no significa es que AlphaGo es perfecto, como lo demuestra el cuarto juego donde Lee ganó. También renuncia cuando cree que sus posibilidades de victoria son inferiores al 20%, lo que podría explotarse en el futuro.

También se demostró que cuando comienza a perder AlphaGo comienza a hacer movimientos peores y peores.

Acerca de las líneas de código, no creo que nadie, aparte de las personas que trabajaron en él, lo sabría, pero apostaría a <1 millón