¿Cuál es la diferencia entre CNN y RNN?

Ambas son redes de redes neuronales diferentes que funcionan bien en diferentes tipos de datos. Los RNN son buenos con series de datos (una cosa sucede después de otra) y se usan mucho en problemas que se pueden enmarcar como “lo que sucederá después …”, mientras que los CNN son especialmente buenos en problemas como la clasificación de imágenes.

Los RNN (redes neuronales recurrentes) están formados por un nodo. Se alimenta de datos, luego devuelve un resultado a sí mismo y continúa haciéndolo. Los avances como LSTM (memoria a corto plazo) hacen que sea inteligente recordar cosas que han sucedido en el pasado y encontrar patrones a lo largo del tiempo para que sus próximas conjeturas tengan sentido.

Las CNN (redes neuronales convolucionales) tienen esencialmente tres partes, capas de convolución, capas de agrupación y capas completamente conectadas. Por lo general, toma una matriz 2D (a veces más dimensiones) y genera un resultado.

La convolución comienza en la parte superior izquierda y toma una pequeña ventana con un cierto ancho y alto y realiza una operación sobre eso, la operación generalmente es una multiplicación de matriz donde la matriz para multiplicar por se decide a través del descenso del gradiente para obtener los mejores resultados finales. Luego se mueve de acuerdo con un parámetro de zancada y hace lo mismo. Hace esto a través de la imagen y genera una nueva imagen.

La agrupación es similar en el sentido de que descompone la imagen usando ventanas pequeñas; sin embargo, la operación que ejecuta en esta pequeña ventana es generalmente (promedio, máximo o mínimo) para combinar la pequeña ventana en un solo píxel.

Después de un conjunto de convoluciones y agrupaciones, la salida final se coloca a través de una capa totalmente conectada, que es una red neuronal de alimentación convencional para generar un resultado.

Puede pensar en las capas de agrupación y convolución como una forma de preprocesamiento de imagen similar a lo que se hizo en la visión por computadora tradicional, excepto que los parámetros como la matriz en cada capa de convolución se deciden por el gradiente de descenso.

Para empezar, tanto CNN como RNN caen en el súper conjunto de redes neuronales. Puedo enumerar algunas diferencias notables entre el también.

  1. CNN es una red neuronal artificial alimentada donde las capas tradicionales se reemplazan con capas de convolución. No tiene memoria para rastrear lo que las capas anteriores han aprendido. Sin embargo, las redes como CrossNets y DenseNets sí permiten la reutilización eficiente de funciones, pero no verifican si las funciones aprendidas son redundantes. Por otro lado, RNN no sigue la estricta naturaleza de retroalimentación y tiene una memoria interna para procesar secuencias arbitrarias de entradas, y recuerda las características aprendidas previamente.
  2. Para ramificarlos en términos de aplicaciones, diría que los CNN se usan principalmente para aplicaciones relacionadas con la visión, mientras que los RNN se usan principalmente para aplicaciones de procesamiento de lenguaje.

Puede consultar estos enlaces para obtener más detalles.

[1702.01923] Estudio comparativo de CNN y RNN para el procesamiento del lenguaje natural

¿En qué se diferencian las redes neuronales recurrentes de las redes neuronales convolucionales?

Hay una increíble cantidad de información sobre esto en Internet. Si escribe su pregunta exacta en Google, encontrará una cantidad infinita de respuestas en todos los niveles de detalle, incluidas dos preguntas anteriores de Quora que son casi exactamente iguales (una solo difiere en 3 caracteres).

¿Cuál es la diferencia entre CNN y RNN?

¿En qué se diferencian las redes neuronales recurrentes de las redes neuronales convolucionales?

More Interesting

¿Puedo usar word2vec para entrenar un clasificador de aprendizaje automático?

Supervisado versus no supervisado, inferencia versus predicción, paramétrico versus no paramétrico, ¿cómo se combinan esas características entre sí?

¿Cuál es el mejor código de Python que extrae todas las frases y parte de las etiquetas de voz (POS) de una oración?

¿Cómo puede una red neuronal ser capaz de razonamiento simbólico? ¿Cómo puede unir variables?

¿Qué es el muestreo de control de casos y por qué necesitamos corregir el término constante en regresión logística (aprendizaje automático)?

¿Cuál es un resumen del trabajo de Jordan Boyd-Graber sobre la Respuesta incremental interactiva a preguntas que le valió el Premio a la Demostración Excepcional de NIPS?

Cómo usar la función Master-Slave de PHPMyAdmin para replicar una base de datos en una máquina diferente

¿Cuál es la diferencia entre Bayes ingenuo y la entropía máxima?

¿Cuál es la mejor manera de aprender Python si mi objetivo es usarlo específicamente para el aprendizaje automático?

¿Cuáles son las diferentes técnicas para el procesamiento del lenguaje natural para resolver un ensayo de clasificación automática?

¿Cuándo debo usar inferencia variacional versus maximización de expectativas para ajustar un modelo de mezcla gaussiana?

¿Cómo funciona el algoritmo de recomendación de YouTube?

En un problema de optimización no convexo, ¿es posible determinar si dos puntos pertenecen al mismo valle o no?

¿Cuál es la mejor manera para que un estudiante de CS en una universidad india obtenga una pasantía / trabajo en una compañía en el sector de Big Data y / o Machine Learning en los Estados Unidos?

¿Podría la red neuronal de convolución completa aprender a discriminar entre clases si no hay muestreo descendente y la entrada es igual a salida?