Ahora que las computadoras han “derrotado” al ajedrez y listo, ¿cuál es el siguiente paso?

El siguiente paso es vencer a los humanos de manera justa, lo que significa mantenerse dentro del presupuesto de energía de ~ 20 W y 1.3 kg de peso del cerebro humano. ¿Cómo se ven las computadoras en 2017, si tenemos en cuenta la desventaja de potencia y peso?

  • En 1997, la computadora de ajedrez IBM Deep Blue pesaba alrededor de 1.4 toneladas y consumía mucha energía (no está claro cuánto, pero probablemente decenas o cientos de kW). Llegó a alrededor de 11.4 GFLOPS, que en 2017 pueden igualar algunas CPU de clase portátil (alrededor de 35 W). En 2009, Pocket Fritz 4 se ejecutó en un teléfono móvil y alcanzó un mayor nivel de rendimiento que Deep Blue. Entonces podemos decir que las computadoras ahora nos han derrotado en el ajedrez.
  • En 2011, Watson de IBM venció a los mejores humanos en Jeopardy, utilizando un grupo de 90 servidores que generaban 80 TFLOPS de potencia informática. IBM ahora está vendiendo esta tecnología de inferencia similar a la humana para diversas aplicaciones a través de un modelo SaaS, pero todavía estamos lejos de empacar esa cantidad de potencia informática en una computadora portátil o teléfono.
  • En 2016, AlphaGo de Google usó 1 MW para vencer a un humano de clase mundial en Go. Un grupo de ese tamaño es pesado, como debe ser para disipar todo ese poder. Al momento de escribir este artículo, un año después, esa eficiencia energética aún no se ha mejorado.

El descendiente de Deep Blue, Pocket Fritz 4, finalmente nos atrapó debido a la Ley de Moore aplicada a la fabricación de productos electrónicos de silicio, un proceso que tomó 12 años. ¿Pueden Watson y AlphaGo seguir el mismo camino para igualar el rendimiento humano? Parece que la Ley de Moore finalmente estará muerta a mediados de la década de 2020, después de más de 50 años desafiando las probabilidades. Por lo tanto, la tecnología Watson podría reducirse al tamaño del teléfono / computadora portátil justo a tiempo antes de llegar a esa barrera. Sin embargo, AlphaGo no tendrá tiempo suficiente para llegar allí. Las opciones para lograr Pocket-AlphaGo parecen ser:

  • Alguna extensión imprevista de la Ley de Moore hasta 2030 y más allá. Esto podría funcionar si alguien gasta suficiente dinero y tiene suerte con la física del material.
  • Un nuevo sustrato informático que utiliza una nueva física elegante, como la computación cuántica, la fotónica, formas exóticas de carbono, etc. Es poco probable que este material esté listo a tiempo, pero en otros 20 años podría ayudar.
  • Mejoras de eficiencia adicionales utilizando métodos de fabricación de silicio existentes, como ASIC de propósito especial optimizados para Go. Esta es la forma en que muchos desarrollos actuales van para redes profundas y otras aplicaciones. Estos métodos traerán ganancias de eficiencia, pero no está claro si será suficiente para alcanzar la eficiencia a nivel humano para Go.
  • Redes neuronales neuromórficas de señal mixta que funcionan en analógico subliminal para lograr mayores reducciones en el consumo de energía, fabricadas utilizando los métodos existentes. Este método podría tener muchos beneficios de consumo de energía a largo plazo, pero la computación de esta manera requiere nuevos algoritmos para manejar de manera sólida los datos ruidosos. Para los contadores esto no es tan bueno, pero para Go podría funcionar.

Divulgación completa: soy fundador de algunas compañías que están desarrollando tecnologías neuromórficas de señal mixta, por lo que pueden adivinar lo que espero que funcione mejor.

En primer lugar, me gustaría señalar que el mayor logro de AlphaGo no está realmente en el hecho de que pueda jugar Go muy bien. Eso en sí mismo no es realmente tan útil. Jugar Go muy bien (al igual que jugar muy bien al ajedrez) realmente no “hace bien” a la humanidad, y no es en sí mismo un objetivo digno de unos meses para un grupo de científicos informáticos líderes en la industria.

El verdadero valor de AlphaGo está en lo que nos enseña sobre el aprendizaje automático y la inteligencia en general. Usando Go como banco de pruebas, desarrollamos algoritmos poderosos que pueden enseñarse a sí mismos cómo reconocer patrones muy complejos y utilizar ese conocimiento para hacer una planificación inteligente y selectiva. También demostramos que este enfoque es mucho más que competitivo frente a los métodos convencionales basados ​​en características cuidadosamente elaboradas, agregando Ir a una lista muy larga de problemas en los que la solución más conocida actualmente se basa en el aprendizaje automático (y redes neuronales profundas en particular). La belleza del enfoque está en su generalidad: las mismas técnicas se pueden aplicar a todo tipo de problemas, no solo los juegos, sino también cosas importantes como el modelado climático y el análisis de enfermedades.

Los juegos solo sirven como un buen banco de pruebas porque hay juegos de todo tipo de diferentes propiedades y dificultades, y nos permite probar nuestras ideas rápidamente e iterar rápidamente. Las pruebas en el mundo real requieren mucho tiempo y son muy costosas, por lo que tratamos de hacer la mayor cantidad de investigación posible sobre los juegos, al igual que los diseñadores de aviones hacen la mayor cantidad de iteraciones posibles en los simuladores, porque eso es mucho más barato y más rápido que realmente construir prototipos!

En términos de qué tipo de juegos, el año pasado DeepMind publicó sus resultados al usar el mismo algoritmo (redes neuronales profundas entrenadas usando Q-learning) para jugar 49 juegos diferentes de Atari, y fueron capaces de lograr un rendimiento humano o superior en más de la mitad de los juegos ( https://storage.googleapis.com/d …).

Hay muchos juegos que aún están fuera del alcance de la IA moderna: juegos en 3D, juegos de estrategia en tiempo real a gran escala (por ejemplo, Starcraft), etc.

Por supuesto, no vamos a esperar hasta que resolvamos completamente la inteligencia antes de comenzar a aplicar nuestro conocimiento para resolver los problemas apremiantes del mundo real que enfrenta la humanidad hoy, cuando ya tenemos la tecnología para causar un gran impacto positivo en este mundo. Ese es el trabajo del grupo DeepMind Applied. Están haciendo muchas cosas realmente geniales, así que estén atentos, y pronto escucharán sobre ellas :).

Descargo de responsabilidad: Todo en esta publicación es mi opinión personal, y no refleja los puntos de vista de mi empleador.

Me encantaría que la IA intente bridge, es un juego de asociación, por lo que las computadoras deberán interactuar entre sí. El juego implica el uso de un lenguaje (pujas) y luego muchas probabilidades y matemáticas en el juego de cartas. Creo que pueden tener mucho éxito si se usa suficiente potencia de la computadora.

Sería divertido ver a un equipo de computadoras ganar el Bermuda Bowl (el campeonato mundial de bridge)

Pero me gustaría argumentar que no estamos viendo inteligencia real sino poder de cómputo, las computadoras ni siquiera saben que están jugando ajedrez o se van y no pueden negarse a jugar, solo están calculando el mejor movimiento en función de cada juego usando una enorme potencia informática y dado que las computadoras son más rápidas que los humanos, es bastante lógico que nos ganen.

De alguna manera, esto es exactamente lo mismo que hacer aritmética, las computadoras son mejores que los humanos haciendo multiplicaciones y otras operaciones aritméticas, pero eso es solo porque son más rápidas.

Luis

Lo más probable, juegos de información imperfecta. Los juegos de mesa son juegos de información perfectos, puedes ver todos los movimientos que hizo tu enemigo y viceversa en el tablero. Sin embargo, los juegos como League of Legends o Starcraft requieren tomar la mejor decisión posible con la información y los recursos limitados que se le proporcionan. Además, a diferencia de los juegos de mesa clásicos, estos juegos no están basados ​​en turnos, lo que significa que no puedes esperar a que tu oponente haga un movimiento, tienes que tomar constantemente la iniciativa si quieres ganar. Por lo tanto, creo que ese es el siguiente paso en la IA, ya que esos juegos están más estrechamente relacionados con la situación del mundo real que los juegos de mesa. Como el mundo real no está basado en turnos, y no se proporciona toda la información.

Chess and Go pertenecen a una clase de problemas que tienen la propiedad de Markov, lo que significa que la decisión óptima solo depende de la observación actual. Las redes neuronales de alimentación directa son adecuadas para esta clase de problema. Sin embargo, si solo podemos observar parcialmente el entorno (póker, por ejemplo), necesitamos construir una memoria a corto plazo. Esto hace que el problema sea mucho más complicado.

El juego con un entorno parcialmente observable y una entrada / estado de alta dimensión sería el objetivo ideal.

Minecraft, por ejemplo.

Para poder diseñar, modificar y mejorar su propio código fuente. (sin destruir el mundo en el proceso)

La autoconciencia y la comprensión de su propio diseño es uno de los problemas no resueltos en la IA.

Reconocimiento de voz mejor que el humano.

Dado que el 95%, si no más, del éxito está en el hardware en ambos casos, todavía estamos muy lejos de cualquier tipo de comprensión formal de cualquiera de los juegos.

Creo que debemos ir en una dirección completamente diferente para tener alguna esperanza de resolver Ajedrez o Ir. ¿Cual direccion? No lo sé, sigo pensando.

Cree una computadora de menos de 20 W que pueda superar constantemente a Magnus Carlsen y sea capaz de aprender y descubrir estrategias propias. De acuerdo con HIARCS en Pocket PC gana el Mercosur Cup 2009 El motor de ajedrez Hiarcs alcanzó el nivel de gran maestro con un “HTC Touch HD (ARM / 528Mhz)”, que supongo que consumirá alrededor de 5W. El motor de ajedrez Giraffe aprende por sí solo, pero “La red del evaluador converge en aproximadamente 72 horas en una máquina con 2 × 10 núcleos Intel Xeon E5-2660v2” arxiv.org/pdf/1509.01549.pdf que es un tdp 2x 95W sin contabilidad para otros subsistemas Por supuesto, los grandes maestros perfeccionan su juego a lo largo de los años. Para recapitular una computadora que aprende 0) por sí sola, 1) en menos tiempo, 2) consume menos energía, 3) juega a un nivel equivalente o mejor que sus contrapartes humanas. No creo que estemos allí todavía, pero estamos cerca, menos de 10 años cerca.

No sé mucho sobre el tema, pero la IA me ha fascinado durante años. Por lo que he visto, el próximo gran salto para la IA sería algo en lo que los humanos sobresalirían, que es un pensamiento abstracto.

Pero eso podría ser un poco difícil para ellos, así que comencemos en algún lugar un poco más fácil. Digamos que el juego debe tener un fuerte componente de conversación para probar verdaderamente la interacción humana. Esta es una prueba fuerte de Turing en la que estoy pensando. Debe ser contextual, tener un elemento de cambio y ser específico para el jugador. También debe estar bastante extendido. Estoy pensando que el próximo juego para vencer que mostraría una IA altamente avanzada sería uno de mis favoritos: Cards Against Humanity.

1) La antigua prueba de Turing.

2) Respuesta visual a la pregunta (ver Respuesta visual a la pregunta).

3) Conducción autónoma (ya hemos avanzado mucho en este caso).

4) Traducción automática.

5) Descubrimiento automatizado de medicamentos y descubrimiento de medicamentos personalizados para enfermedades adaptativas como el cáncer.

AlphaGo no ha vencido a Go. Venció a un profesional de bajo nivel (7 rangos por debajo de los mejores humanos del mundo). El programa requeriría una desventaja de 3 piedras de los mejores del mundo.

En otras palabras, requeriría una diferencia de 45 puntos en la puntuación, cuando la mayoría de los juegos profesionales se deciden por 1/2 punto. Debido a las reglas, los lazos son imposibles en Go.

Bueno, ya sucedió: composición musical profesional: http://en.wikipedia.org/wiki/Mel

Para realmente salvar la vida de una persona (a través de una toma de decisiones médicas superior).