¿Cuál es un resumen del trabajo de Jordan Boyd-Graber sobre la Respuesta incremental interactiva a preguntas que le valió el Premio a la Demostración Excepcional de NIPS?

Primero, este no era solo yo. También fueron Mohit Iyyer, He He y Hal Daume.

Tenemos un resumen del proyecto (y enlaces a documentos):

Pensamiento bayesiano en tus pies: incrustando modelos generativos en el aprendizaje por refuerzo para datos revelados secuencialmente

La versión corta es que tenemos una red de promedios profundos que genera un montón de conjeturas a las preguntas y luego tenemos un sistema de aprendizaje por refuerzo que decide cuándo responderla o no. Hay una explicación más larga en nuestro video con Ken Jennings.

Además del componente de investigación, fue bastante interactivo porque teníamos humanos compitiendo entre sí y contra el sistema. Fue muy divertido, en mi opinión sesgada. 🙂

ACTUALIZACIÓN 2017: Estamos realizando un concurso de preguntas y respuestas entre humanos y computadoras en NIPS 2017. ¡Únete a la diversión!

More Interesting

¿Debo aprender primero el aprendizaje profundo o de refuerzo? ¿Hay un orden natural? ¿Debería hacerse al mismo tiempo?

Procesamiento del lenguaje natural: ¿Hay alguna manera de medir la "informatividad" de una oración en un documento?

¿Cómo podemos usar la herramienta Weka para crear un sistema de recomendación?

Cómo construir sobre modelos de red profunda de detección de objetos pre-entrenados (YOLO) para detectar nuevas clases

Como desarrollador web junior sin una sólida base matemática, ¿qué enfoques debo tomar para dominar el aprendizaje automático y aplicarlo al mundo empresarial? Acabo de empezar a estudiar la "Introducción al álgebra lineal" de Gilbert Strang.

¿Algún investigador utiliza ReLU en un modelo de aprendizaje no profundo? ¿ReLU es solo para aprendizaje profundo?

Cómo reducir la dimensionalidad en la agrupación promedio global para que coincida con el tamaño de softmax

¿Cuáles son algunos buenos documentos sobre la extracción de sinónimos de los registros de consultas?

¿Se ha realizado algún trabajo para hacer que la regresión lineal sea amigable para el laico?

¿Qué tema es importante para la ingeniería integrada, las redes neuronales o la automoción moderna?

¿Cómo manejan las empresas en Silicon Valley sus datos de flujo de red?

¿Puede una sola red neuronal de capa oculta aprender a jugar Atari Pong desde píxeles sin formato de un solo cuadro?

¿Cuál es la intuición detrás de llamar variables ortogonales como independientes? Proporcione una respuesta en el contexto del aprendizaje automático.

¿Cómo se puede aplicar el aprendizaje automático al póker?

¿Por qué los diseñadores o los PM deben aprender sobre el aprendizaje automático?