¿Cuáles son los desafíos con los formatos de video para el aprendizaje automático?

Obviamente, los videos pueden tener una gran cantidad de datos, lo cual es excelente para el aprendizaje automático, pero es difícil para su (s) computadora (s).

La estructura de los datos de video es diferente de la mayoría de las cosas. Tiene información estructural en tres dimensiones (eje x, eje y y tiempo). Esto sigue siendo una gran noticia para ML. Nos permite usar redes convolucionales o redes convolucionales recurrentes para hacer las mismas tareas con menos parámetros.

La verdadera dificultad con los datos de video es que contiene mucha información. Dependiendo de su tarea, extraer lo relevante puede ser muy difícil. Hay mucho ruido (lea: otra información) que no es útil para usted y facilita el sobreajuste de la red.

Debido a que la información contenida en un video puede ser tan compleja, muchas tareas relacionadas con el video pueden ser muy difíciles.

¡Ni siquiera hemos considerado la entrada de audio todavía! Es posible que esté utilizando una CNN en el video, pero es posible que deba combinarlo con el audio. Combinar dos fuentes de datos con una estructura muy diferente puede ser complicado (y generalmente lo es).

Aprendizaje automáticoinformáticaInteligencia ArtificialVideos

Related Content

Si tengo un año para ser realmente bueno en programación algorítmica y todavía no he probado suerte en programación competitiva, ¿cuál debería ser mi enfoque?

¿Cómo fue usar teclados de computadora antiguos?

¿Cómo utiliza la informática el método científico?

¿La teoría de juegos y las disciplinas relacionadas son puramente de interés académico, o tienen también importantes aplicaciones industriales?

Mapas: ¿Dónde podemos encontrar la lista de todos los pueblos de la India con su longitud y latitud?

¿Cómo podemos hacer un nuevo invento?

¿Sabes dónde puedo encontrar un robot similar a Robi?

More Interesting

¿Cuál es la mejor manera de aprender / enseñar AP Computer Science?

¿Qué tan cerca estamos de crear una supercomputadora en la que podamos insertar una conciencia humana?

¿Qué beneficios ofrece Oracle Identity Manager?

¿Cuál es el significado de los gráficos planos en informática?

¿Alguien puede explicar la arquitectura de Von Neumann?

Criptografía: ¿Cuál es una explicación intuitiva de una red de sustitución-permutación?

Cómo alcanzar el nivel de matemáticas requerido para participar en el Concurso Internacional de Programación Colegiada

Cómo ver si se está bloqueando la computadora

¿Los hackers de crecimiento y los ingenieros de crecimiento están aquí para quedarse?

¿Qué es un píxel? ¿Cómo se puede medir en métrica?

¿Puedo usar más mapeadores y reductores simultáneamente en un programa MapReduce usando el concepto de subprocesamiento de Java? Si es así, ¿cómo? Si no, ¿por qué?

¿Qué debo hacer / investigar antes de ingresar a la universidad con una especialización en Ciencias de la Computación?

¿Qué industrias serán las últimas en utilizar el aprendizaje automático?

¿Cuál es el futuro del experto en computación en la nube?

¿Puedo obtener CS en VIT Vellore con un rango de 62000?

Web Analytics