Digamos que DeepMind puede construir otro AlphaGo, exactamente igual al existente. ¿Qué pasará si estos dos AlphaGos juegan uno contra el otro?

Esto depende completamente de los límites de tiempo elegidos y la cantidad de hardware disponible. Si usa el mismo hardware y límites de tiempo para los juegos contra Lee Sidol, vería juegos extremadamente fuertes de calidad similar a los de Lee Sidol, con la mayoría de los juegos que terminan en medio punto de diferencia, pero otros son explosiones completas cuando una versión encuentra un movimiento sorprendente que estaba un poco más allá del horizonte de su versión oponente.

Menos hardware o menos tiempo daría como resultado juegos más débiles.

Cada doble de CPU era de 100 puntos para duplicaciones tempranas, con rendimientos decrecientes para duplicaciones posteriores. Cada duplicación de GPU fue probablemente 50 puntos de ELO para duplicaciones tardías (con la primera duplicación ofreciendo un gran beneficio: 500 Elo, pero después de eso 100 luego disminuyendo rápidamente). Entonces, en hardware modesto con límites de tiempo razonables tan buenos como profesionales de nivel inferior.

Related Content

Quiero ser programador de juegos. ¿Como llego hasta ahí?

¿Qué tecnología se usa en WhatsApp?

¿Cómo puede la tecnología ayudar a los corredores?

¿Qué tan lejos estamos tecnológicamente de poder construir la nave espacial estrella de riesgo ISV de Avatar?

¿Hay una máscara con cancelación de ruido que pueda usar que evite que otras personas escuchen mi discurso pero que no sea tan elaborado como el siguiente?

¿Cuántos años le tomaría a una nave espacial llegar a Alpha Centauri a la máxima velocidad posible con la tecnología moderna?

¿Qué problemas humanos cotidianos no pueden ser resueltos por las computadoras?

En realidad, así es como AlphaGo mejora. Después de una etapa inicial usando juegos humanos, se juega solo y aprende de él usando el aprendizaje de refuerzo. En el artículo de Nature, los autores escribieron

En este artículo describimos nuestro programa Go, AlphaGo. Este programa se basó en métodos de inteligencia artificial de uso general, utilizando redes neuronales profundas para imitar a jugadores expertos y mejorando aún más el programa al aprender de los juegos jugados contra sí mismo.

El programa juega contra sí mismo. Uno de ellos gana. Los resultados se utilizan para mejorar las redes neuronales que utiliza.

Deem Chen

More Interesting

¿Qué es mejor, GLONASS o GPS?

¿Cuáles son los mejores teléfonos nuevos que vendrán en 2016?

¿Cuáles son los detalles del incidente de tránsito que ocurrió en SF el primer día de autos sin conductor de Uber?

Cómo aprovechar mejor el mundo tecnológico en ascenso

¿Por qué las empresas en NASDAQ cotizan en forma abreviada? Como Apple - AAPL, Google - GOOG, etc.

¿Por qué parpadea una pantalla de televisión cuando grabas un video cuando en realidad no lo hace?

¿Cómo podría usarse la tecnología para involucrar al equipo de ventas de campo en el rendimiento del producto?

¿Hay algún virus informático que aumente la velocidad de procesamiento de una computadora?

¿Se puede usar un teléfono inteligente durante una caminata espacial o en la superficie de la luna?

¿Por qué las velocidades de Internet no son instantáneas dada la tecnología actual?

¿Qué quieres decir con el software Travel Technology?

Cómo externalizar adecuadamente un proyecto tecnológico

¿Cuál es el mejor grado tecnológico?

¿Qué tecnología tendría el mayor alcance en el futuro, por ejemplo, la web, las aplicaciones, el IoT, la IA o el análisis de datos, etc.?

¿Debería competir con Google?

Web Analytics