¿Cómo se codifica algo como AlphaGo de Google DeepMind? ¿Cuántas líneas de código se utilizan para construir un programa tan avanzado?

Ahora, no soy un experto, así que corrígeme si me equivoco sobre algo, pero sé un poco sobre esto.

No sigue el método de fuerza bruta (analizando todas las posibilidades) debido a la gran cantidad de posibilidades en Go, sino que se basa en una combinación de dos cosas junto con Machine Learning.

Búsqueda de árbol de Monte Carlo: implica elegir movimientos al azar
luego simulando el juego hasta el final para encontrar una estrategia ganadora.
Redes neuronales profundas: una red de 12 capas de conexiones neuronales
que consiste en una red que selecciona el siguiente movimiento y un
red que predice el ganador del juego.

Un punto peculiar de AlphaGo es que, en lugar de tener movimientos “buenos” y “malos”, estudió una cantidad increíblemente grande de partidos de Go. Y utilizando el aprendizaje profundo logró un estado en el que ganaría la mayoría de sus partidos

Ahora, lo que esto no significa es que AlphaGo es perfecto, como lo demuestra el cuarto juego donde Lee ganó. También renuncia cuando cree que sus posibilidades de victoria son inferiores al 20%, lo que podría explotarse en el futuro.

También se demostró que cuando comienza a perder AlphaGo comienza a hacer movimientos peores y peores.

Acerca de las líneas de código, no creo que nadie, aparte de las personas que trabajaron en él, lo sabría, pero apostaría a <1 millón

Si construí una IA que descubrió algo, y ese descubrimiento fue galardonado con el Premio Nobel. ¿Podría ser considerado el ganador de eso?

¿La traducción automática hará que aprender un idioma extranjero sea innecesario?

¿Qué opina de Sophia, el robot de IA?

Cómo construir un motor de chatbot como wit.ai o chatfuel

¿En qué circunstancias se ejecutarían 100 procesos del sistema operativo más rápido en 5 lotes en serie de 20 en lugar de todos en paralelo?

¿Es útil entrenar a AlphaGo jugando contra sí mismo?

More Interesting

¿Cuántas matemáticas usas en tu trabajo de aprendizaje automático?

¿Qué tan pronto los conductores de montacargas serán reemplazados por máquinas?

¿El basilisco de roko se aplica a personas que no son lo suficientemente inteligentes como para afectar la trayectoria de la formación de IA?