El año pasado fue enorme para que los avances en inteligencia artificial y aprendizaje automático sean los siguientes:
- Refuerzo positivo
El aprendizaje de refuerzo se inspira en las formas en que los animales aprenden cómo ciertos comportamientos tienden a dar como resultado un resultado positivo o negativo. Con este enfoque, una computadora puede, por ejemplo, descubrir cómo navegar por un laberinto por prueba y error y luego asociar el resultado positivo, salir del laberinto, con las acciones que lo llevaron a él. Esto permite que una máquina aprenda sin instrucciones o incluso ejemplos explícitos. La idea ha existido durante décadas, pero combinarla con redes neuronales grandes (o profundas) proporciona la potencia necesaria para que funcione en problemas realmente complejos (como el juego Go). A través de la experimentación implacable, así como el análisis de juegos anteriores, AlphaGo descubrió por sí mismo cómo jugar el juego a un nivel experto.
La esperanza es que el aprendizaje por refuerzo ahora resultará útil en muchas situaciones del mundo real. Y el lanzamiento reciente de varios entornos simulados debería estimular el progreso en los algoritmos necesarios al aumentar el rango de habilidades que las computadoras pueden adquirir de esta manera.
- ¿Qué tan difícil sería para alguien hacer una IA que pueda interactuar contigo sin conocimiento previo?
- Visión por computadora: ¿Cuáles son los trabajos más interesantes de CVPR 2012?
- ¿Cómo se calcula el refuerzo?
- ¿Cuál es la diferencia entre el reconocimiento de emociones y el análisis de sentimientos?
- ¿Cuál es el propósito del sesgo en una neurona artificial?
En 2017, es probable que veamos intentos de aplicar el aprendizaje por refuerzo a problemas como la conducción automatizada y la robótica industrial. Google ya se ha jactado de utilizar el aprendizaje de refuerzo profundo para hacer que sus centros de datos sean más eficientes. Pero el enfoque sigue siendo experimental, y aún requiere una simulación que requiere mucho tiempo, por lo que será interesante ver qué tan efectivamente se puede implementar.
2. Redes neuronales en duelo
En la reunión académica de inteligencia artificial celebrada recientemente en Barcelona, la conferencia de Sistemas de Procesamiento de Información Neural, gran parte del rumor se refería a una nueva técnica de aprendizaje automático conocida como redes generativas de confrontación.
Inventado por Ian Goodfellow, ahora científico investigador de OpenAI, las redes de confrontación generativa, o GAN, son sistemas que consisten en una red que genera nuevos datos después de aprender de un conjunto de entrenamiento, y otra que trata de discriminar entre datos reales y falsos. Al trabajar juntos, estas redes pueden producir datos sintéticos muy realistas. El enfoque podría usarse para generar escenarios de videojuegos, desdibujar secuencias de video pixeladas o aplicar cambios estilísticos a los diseños generados por computadora.
Lee mas…