Si tenemos los datos en bruto de muchas secuencias y las imágenes correspondientes de sus tramas, ¿hay alguna razón por la que debamos usar la imagen en lugar de los números originales para aprendizaje automático / profundo?

Lo que he entendido de esta pregunta es que tiene datos sin procesar de bytes que representan una imagen y se pregunta cuál es la deferencia entre dos modelos, uno usa los datos sin procesar como entradas y otro usa la imagen completa.

Si esa es su pregunta, entonces la respuesta es que cada método y ANN profundo difieren por la forma en que maneja los datos LSTM lo manejan byte a byte para que capture la dependencia del orden de los bytes a los que se introducen.
ConvNets captura los patrones de datos dentro de su ventana para que una capa no capture la dependencia de dos patrones separados unos de otros. Supongamos que tiene una secuencia de datos numéricos que representan la intensidad de la luz de cada píxel en la fila principal y un ConvNet 1D multicapa. Esta red capturará el patrón, pero cada capa combina los patrones de la misma manera (en la fila principal), lo que le será difícil capturar la dependencia entre una fila y otra.

Entonces, ¿por qué usamos 2D ConvNet? porque como humanos identificamos el patrón en las imágenes en las dos dimensiones mirando la imagen completa, no mirándola línea por línea. Eso hace que el patrón se extienda en la línea del multiplicador y hace que el 2D ConvNet sea bueno para identificarlo.

Aprendizaje automáticoAprendizaje profundoImágenesInteligencia ArtificialProcesamiento deReconocimiento de imágenes

Related Content

¿Por qué tantos videojuegos tienen terribles IA?

¿Cuál es la diferencia entre el aprendizaje por refuerzo y el aprendizaje por refuerzo inverso?

¿Cuál es la salida de una red neuronal para la agrupación supervisada de datos secuenciales?

Cómo comenzar con el aprendizaje automático

¿Cuáles son las críticas efectivas, si las hay, del 'Principio de optimismo' de David Deutsch: que todo mal proviene de la falta de conocimiento?

Cuando hacemos que la IA sea consciente y sienta que es un dolor de entrenamiento existente, ¿seremos torturadores?

¿Cómo y qué tipo de paquetes diseñados se utilizan en las pruebas de penetración?

Personalmente, no veo ninguna ventaja de usar CNN en los datos de la imagen 2d ya que podríamos usar una CNN 1d en los números sin procesar.

Ahmad Bashar Eter

More Interesting

¿Por qué Nederland no crea empleados con inteligencia artificial para reemplazar a los inmigrantes?

Si el universo de The Matrix era toda una ilusión, ¿por qué Matrix necesitaba mantener vivos a tantos humanos? ¿No sería mucho más útil mantener el número de humanos relativamente bajo para fines de control y uso de energía?

¿Qué documentos recomienda para que estudie un principiante de Machine Learning?

¿La IA potencialmente reemplazará a los agentes humanos del centro de llamadas pronto? ¿Cuánto tiempo antes de llegar a ese punto?

¿Cuáles son algunos ejemplos de 'ideas de bot de chat' que podrían cambiar mucho el mundo?

Inteligencia artificial: ¿Cómo las redes neuronales convolucionales identifican las emociones humanas?

Cómo manejar coordenadas geoespaciales en aprendizaje automático

¿Cuáles son algunos de los mejores algoritmos de IA para juegos de 2 jugadores como Ultimate Tic Tac Toe?

¿No dependería la calidad de un robot de IA de la cantidad de código que uno escribe en respuesta a todas las posibilidades / interacciones que enfrentaría?

Cómo participar en una competencia de Kaggle con una computadora portátil

¿Pueden las máquinas (o cualquier IA actual) producir ideas?

Inteligencia artificial: ¿está vivo hoy Miles Dyson, el creador de Skynet?

¿Por qué los ingenieros y científicos famosos dicen que la IA es peligrosa?

¿Es posible programar un sistema que siga recibiendo información constantemente para que tome algunas decisiones, y luego aprenda de sus decisiones pasadas y de la información recibida, para refinar las decisiones que tomará en el futuro?

¿Cuál es la diferencia entre un motor de reglas y un motor de inferencia, ejemplos?

Web Analytics