¡Creando un trailer de la película!
El año pasado, 20th Century Fox lanzó un avance (ver aquí), afirmando ser el primero creado por AI / Machine Learning (IBM Watson). La película fue un thriller de terror de IA, Morgan .
A pesar de los titulares como Watch: Watson de IBM creó un tráiler de película súper espeluznante por sí mismo, Watson no lo hizo todo por sí mismo. Todo lo que hizo Watson fue elegir 10 escenas (un total de 6 minutos de metraje) de la película que deberían aparecer en el avance, y un cineasta humano luego editó las escenas y agregó la superposición musical.
- Cómo diferenciar entre características globales y características locales en una imagen
- ¿Cuáles son algunos temas inusuales en el aprendizaje automático que se pueden explorar como un proyecto de un mes?
- ¿Por qué en cualquier máquina eléctrica la corriente aumenta cuando aumenta la carga de esa máquina?
- ¿Por qué decimos que la máquina de vectores de soporte y muchas otras técnicas de aprendizaje automático tienen un supuesto subyacente de iid?
- Veo que la mayoría de las API de Machine Learning están en Python, algunas usan C o C ++ bajo el capó. ¿Por qué los desarrolladores de framework no exponen las API de C ++?
Sin embargo, es impresionante. En un alto nivel, así es como Watson eligió esas 10 escenas:
- Los humanos primero vieron los trailers de 100 películas de terror y etiquetaron cada escena de cada trailer como ‘ misteriosa ‘, ‘ aterradora ‘, ‘ tierna ‘, etc.
- Watson luego analizó el audio y el video de esas escenas para saber qué significan las escenas y las etiquetas correspondientes. Por ejemplo, podría haber aprendido algo como:
- Música relajante + Niño sonriendo = Escena tierna .
- Silencio + Persona llorando = Escena triste .
- Sonido crujiente + Puerta abriéndose lentamente = Escena de suspenso .
- Grito + cara sangrienta durante 1 milisegundo = escena de miedo .
- Watson ahora sabe qué tipo de escenas suelen aparecer en un avance de una película de terror, en términos de características de audio y video.
- Watson fue alimentado con la película de larga duración ( Morgan ). Analizó las características de audio y video de todas las escenas de la película e identificó 10 escenas que serían los mejores candidatos para un avance.
Así fueron elegidas las 10 escenas. Y según el blog de IBM, Watson ayudó a reducir lo que podría ser un proceso de una semana a solo un día .
Pero no se equivoque, esto no es equivalente a máquinas que aprenden creatividad o incluso miedo . En lo que respecta a la mayoría de las características visuales, cualquier sistema de ML probablemente trata a Samara saliendo de la televisión en The Ring y a un bebé saliendo de una cuna como casi lo mismo .