¿Por qué solo se utilizan redes neuronales convolucionales para imágenes, en lugar de otras técnicas de aprendizaje profundo?

Corrección: las convoluciones generalmente se usan en imágenes con RNN que se usan alguna vez. Además, la mayoría de las redes neuronales convolucionales tienen capas FC, las redes convolucionales puras son raras.

Entonces por qué ?

¡Porque teóricamente podrías usar también DenseNets completamente de imágenes, pero eso requeriría conjuntos de datos aún más grandes que los actuales convnets! Los convexos tienen una arquitectura única en la que las circunvoluciones reducen las dimensiones de la imagen mediante la extracción de características locales, de modo que los datos sobre los que se debe entrenar la capa densa son menores y se pueden ajustar.

Si le preguntas a Convnets vs RNNs en imágenes, simplemente sucede que parece que las convnets funcionan mejor en las imágenes. No es que no se usen RNN. Este sesgo parece que los RNN funcionan mejor en sonido y texto.

Aprendizaje automáticoAprendizaje profundoInteligencia Artificialneuronales convolucionalesRedesRedes neuronales artificiales

Related Content

¿Qué piensa Pedro Domingos de OpenAI?

Programación de computadoras: ¿Cómo se creó la IA de Tekken 3?

¿Qué es mejor, IBM Watson o Bank of America?

Como intuitivamente tiene sentido decir que el verdadero potencial de la IA radica en desbloquear nuestra comprensión del cerebro humano, ¿dónde se encuentra la neurociencia?

¿Podría Google AI predecir qué vas a Google a continuación?

Al sintonizar una red neuronal, ¿cuánto tiempo suele esperar mientras entrena antes de cambiar los hiperparámetros y probar otra configuración?

¿Qué pasa si la moral en la Biblia no es más que patrones de entrenamiento para nuestras redes neuronales profundas?

No es cierto, CNN solo se usa en imágenes en lugar de algún módulo de aprendizaje profundo como Deep Generative Models, la red neuronal recurrente se usa mucho hoy en día.

La teoría de la red neuronal convolucional (CNN) se extrae del sistema de procesamiento visual humano. CNN proporciona un conjunto de filtros jerárquicos en la imagen y, finalmente, extrae muchas características latentes que realmente concluyen un significado semántico para la imagen. Por esta razón, CNN es el mejor intérprete para las imágenes.

Pero el modelado generativo como Deep Belief Network, Deep Boltzmann Machine, Generating Adversarial Networks se utilizan para la síntesis, generación y clasificación de imágenes.

Para la segmentación de imágenes y la generación de subtítulos, se utilizan la red neuronal recurrente (RNN) y la integración CNN-RNN.

Rabindra Nath Nandi

More Interesting

¿Podría una computadora recrear a un hipster? ¿O ser irónico?

¿Existe algún experimento lo suficientemente avanzado que permita a AI escribir ficción, tal vez basada en una trama? ¿Algún investigador en particular que conoces?

¿Por qué API AI no es de código abierto?

Si Siri tuviera una cara, ¿cómo sería (él / ella)?

¿Cuál es el mejor libro como introducción a Python y la inteligencia artificial?

¿Quién es pionero actualmente en el campo de la IA? ¿Cuándo podemos esperar un gran avance?

¿La inteligencia artificial solo involucra a robots?

¿Dónde se encuentran la inteligencia artificial y el Big Data desde el punto de vista del Big Data?

¿Dominarán las empresas chinas en el diseño de AI ASIC?

¿Cuáles son algunos ejemplos de inteligencia artificial que no son Machine Learning?

¿Podría alguien darme una visión general del mercado de inteligencia artificial para ventas y CRM?

¿Cuáles son los buenos sitios web y foros de inteligencia artificial?

¿Es posible que AI trabaje con un solo procesador?

¿Quora intenta convertirse en un motor de conocimiento de inteligencia artificial como la próxima evolución de un motor de búsqueda?

¿Qué es el proceso de mecanizado?

Web Analytics