¿Hay proyectos de inteligencia artificial que se centren en descripciones de audio para video?

Ese tipo de proyecto es un objetivo a largo plazo. Necesitaría un sistema extremadamente capaz para poder unir todas las partes: reconocer objetos, personas y lugares, determinar intenciones, acciones y motivaciones, analizar el enfoque previsto de esas acciones mientras elimina los datos irrelevantes y luego tomar todo eso y formando oraciones coherentes que se pueden pronunciar dentro de los límites de tiempo de la acción. Cualquier IA capaz de hacer eso necesitaría tener capacidades para comprender el ingreso de datos en los niveles humanos.

Por el momento, lo más cercano que tenemos son los sistemas que pueden reconocer imágenes, sonidos o personas específicas y pegarles una etiqueta. Ninguno todavía es capaz de reconocer acciones (por ejemplo, balancear un hacha en lugar de simplemente apoyarlo contra una pared) o cómo el contexto puede cambiar el significado (cuando alguien balancea un hacha contra un árbol, está cortando madera, cuando alguien balancea un hacha una puerta en la que están entrando).

informáticaInteligencia ArtificialInteligencia Artificial General

Related Content

¿Los físicos son realmente mejores en aprendizaje automático que los informáticos?

Cómo escribir un correo electrónico que llame la atención del profesor de informática para un doctorado

¿Cuáles son algunos de los trucos que se pueden usar en YouTube, Quora, Facebook o en otros sitios?

¿Puedes sugerir algún buen proyecto de Linux para menores de último año?

Cómo multiplicar números de complemento a dos de punto fijo

¿Por qué control + alt + delete no funciona?

¿Están disponibles los detalles completos de una RAM de PC?

More Interesting

¿Son todos los 500 mejores supercomputadores iguales, en términos de computación?

¿Por qué una tubería más profunda podría traer velocidades de reloj más rápidas?

¿Cuál fue la función principal de los tubos de vacío en las computadoras de primera generación?

¿Por qué nadie ha implementado un sistema operativo peer-to-peer basado en el consumidor?

¿Cuáles son algunos buenos libros de nivel de entrada para Machine Learning?

¿Cómo puedo restar 110001 de 1011 usando el método de complemento a 2?

Cómo hacer una copia de seguridad de mis programas en Linux e instalarlos en otra PC que no tenga Internet

¿En qué se diferencia la entrevista de pasantía SWE de Facebook de la de Google?

¿Hay muchos investigadores de aprendizaje automático que son escépticos sobre el éxito del aprendizaje profundo?

¿Cuál es la diferencia entre un kernel y un sistema operativo?

¿Cómo está cambiando el aprendizaje automático la publicidad en línea?

Si quiero escribir un compilador y hacer rodar a mano mi propio lexer / parser (sin lex / yacc o antlr), ¿cuál es el enfoque más fácil?

¿Por qué se usa x86 para denotar 32 bits?

¿Cuáles son algunos algoritmos geniales de computadora?

¿Qué hace que un curso de CS de 3 o 4 años sea valioso?

Web Analytics