Como Robby y Michael ya han mencionado, los modelos actuales de aprendizaje automático no tienen modelos mundiales suficientemente sofisticados que puedan tomar como entrada una historia y generar una sinopsis de la misma en forma de un libro de dibujos animados.
El artículo de ICLR 2017 Seguimiento del estado mundial con redes de entidades recurrentes es quizás representativo del estado actual del arte en los modelos mundiales que puede construir una máquina, que todavía está muy lejos de generar una sinopsis requerida para un libro de dibujos animados
- Cómo comprender mejor las funciones de activación en el aprendizaje automático, especialmente las matemáticas detrás de ellas
- ¿Cuál es el mejor marco de aprendizaje profundo para Apache Spark?
- ¿Cuál es el mejor método de extracción de características para OCR en texto chino escrito a mano?
- ¿Cómo se pueden usar los modelos ocultos de Markov para reconocer la escritura cursiva?
- ¿Hay alguna manera de extraer la función subyacente de una red neuronal entrenada?
Del artículo Seguimiento del estado mundial con redes de entidades recurrentes
Sin embargo, los modelos actuales son bastante buenos para generar subtítulos de texto a partir de imágenes, que solo requieren información presente en la imagen. Por ejemplo, en el artículo Neural Image Caption Generation with Visual Attention, Bengio et al, una red neuronal convolucional produce como representación de salida de una imagen, que luego es procesada por un RNN con un mecanismo de atención que se enfoca en las regiones de la imagen que generan el subtítulo. Esta generación solo requiere información presente en la imagen: un libro de dibujos animados en contraste requeriría una sinopsis del texto original, lo que exigiría la existencia de un modelo mundial, incluso si es solo rudimentario ( puede que no resuelva los problemas planteados en el esquema de Winograd ) que puede realizar tal tarea.
Generación de subtítulos de imágenes neuronales con atención visual, Bengio et al.
Ejemplo de generación de subtítulos de imagen de un artículo de Nature de 2015 sobre aprendizaje profundo
Referencias Adicionales
- Como la pregunta había mencionado sobre la generación de música como ejemplo, hay otro documento presentado para ICLR 2017 el próximo mes (abril) que describe un modelo para la generación de música. https://openreview.net/pdf?id=By…
- Enlace de documentos de ICLR 2017