¿Cuál es la diferencia entre una red neuronal, propagación hacia atrás, red convolucional, aprendizaje profundo y aprendizaje extremo?

Voy a mantener la respuesta lo más simple posible, no entraré en los detalles matemáticos sangrientos. Así que aquí va.

Red neuronal: un algoritmo inspirado en las neuronas de nuestro cerebro. Considérelo como una función matemática f (x). Le das una entrada x y te da una salida y. Tan sencillo como eso. Ahora las redes neuronales se utilizan para un propósito especial y, por ejemplo, para el aprendizaje supervisado. Las redes neuronales se pueden entrenar para aprender y esa es su USP. Se puede entrenar para clasificar algo tan simple como imágenes de perros y gatos o se pueden escalar para identificar cientos de clases como autobús, tren, bicicleta, etc.

Ahora, cómo aprende con el tiempo es a través del algoritmo de propagación inversa. Las redes neuronales tienen algo llamado pesos y capas ocultas. Sus características de entrada se alimentan directamente en estas capas y se propagan, es decir, se multiplican con los pesos contenidos en las capas ocultas y finalmente obtiene una salida. Ahora, el resultado que obtiene después de la primera iteración tendrá una diferencia significativa con respecto a sus objetivos, que se calcula a través de una función llamada función de pérdida. Una función de pérdida no es más que una función que le da una medida de cuán lejos está su salida del objetivo. Ahora, en función de la pérdida, modificamos los pesos de las capas para que en la próxima iteración la salida se acerque a los objetivos y la pérdida disminuya. Por lo tanto, el método con el que ajustamos los pesos ( restamos de los pesos un pequeño valor llamado gradiente que calculamos diferenciando la entrada de pérdida de wrt ) en muchas iteraciones para que la pérdida baje es lo que colectivamente se llama propagación inversa.

Ahora llegando a CNN, es muy similar a su red neuronal artificial. La diferencia radica en la arquitectura. En la red neuronal ordinaria tenemos capas y pesos ocultos, mientras que en CNN tenemos filtros que colectivamente forman sus capas de convolución. Un filtro es como una matriz de pesos. Cada filtro comparte un conjunto de pesos, que involucra la imagen de entrada. Ahora, la convolución no es más que aplicar un producto de puntos entre los filtros y la imagen de entrada y luego tomar una suma. De esta manera, después de una serie de convoluciones, dependiendo de cuántas capas conv tiene en su red, llegamos a una salida. Nuevamente, se calcula la pérdida y dependiendo de la pérdida, aplicamos la propagación inversa para reajustar los pesos de los filtros. Así, esencialmente, con el tiempo, su CNN aprenderá a clasificar sus imágenes de entrada. La ventaja de CNN sobre ANN es que CNN comparte los mismos pesos entre su filtro, por lo tanto, hay menos cálculos en comparación con ANN y, por lo tanto, podemos permitirnos aumentar el número de capas conv que no habrían sido posibles en caso de ANN debido a Grandes cálculos involucrados. Las CNN se utilizan ampliamente y han dado resultados de última generación en la clasificación de imágenes.

Si desea obtener más información sobre NNs, CNNs, back-prop, le sugiero que eche un vistazo a las conferencias CSE 231n Stanford sobre aprendizaje profundo y también los videos de conferencias de aprendizaje automático extremadamente populares de Andrew Ng. Le dará una comprensión sólida del tema.

Redes neuronales: algoritmos de aprendizaje automático que son masivamente paralelos y utilizan muchas neuronas / unidades para hacer los cálculos. Pueden estar inspirados en cosas del cerebro.

Backpropagation: un algoritmo para encontrar la derivada de error para cada parámetro en la red neuronal. Es una aplicación inteligente de la regla de la cadena de cálculo.

CNN: un tipo especial de redes neuronales que comparten pesos entre unidades y donde las unidades están conectadas solo con unas pocas unidades en la siguiente capa.

Aprendizaje profundo: redes neuronales profundas. En realidad, un cambio de marca de las redes neuronales para verse mejor, publicar los artículos y generar exageración.

Aprendizaje extremo: una rama del aprendizaje automático que se utiliza en el sudeste asiático, donde gran parte del aprendizaje se basa en pesos aleatorios. Odiado en Occidente y según muchos científicos (como Yann Lecun), es una idea estúpida, los resultados no son tan buenos como afirman los investigadores y los investigadores solo se citan y publican en sus propias conferencias. Nunca lo probé, pero se ve mucho mumbo jumbo desde el exterior.

Red neuronal: una composición de función, es decir, [matemáticas] f (g (h (…))) [/ matemáticas], o un gráfico acíclico dirigido probabilístico sin bordes dentro de la capa.

Backprop: una implementación de diferenciación automática y ampliamente utilizada en la optimización de funciones de costos de redes neuronales.

ConvNet: una red neuronal cuyo operador entre un peso y una entrada es convolución.

Aprendizaje profundo: un paradigma de aprendizaje en el que las características se extraen automáticamente de alguna entrada “relativamente” sin procesar.

Máquina de aprendizaje extrema (quizás quiso decir esta): una red neuronal que originalmente consta de 1 capa oculta y sus pesos se resuelven utilizando mínimos cuadrados (los pesos de las redes neuronales en general se resuelven mediante algunas técnicas de optimización iterativa basadas en derivadas de primer orden calculado por Backprop).

Espero que sea útil.

More Interesting

¿Por qué la inicialización de pesos por números pequeños es mala en las redes neuronales?

¿Cuál es el futuro de la robótica y la IA en Vietnam?

¿En qué sentido los HBF (funciones de base hiper) extienden RBF (funciones de base radial) en el aprendizaje automático?

¿Podría una revuelta robot / IA ser el 'Gran filtro' que algunos han propuesto para explicar la paradoja de Fermi?

¿Cómo funciona el método de abandono en el aprendizaje profundo? ¿Y por qué se afirma que es un truco efectivo para mejorar su red?

¿Cómo podrían usarse las expresiones faciales para medir los niveles de amenaza usando redes neuronales?

¿El concepto de inteligencia artificial excluye la noción de conciencia artificial y emoción artificial?

¿A dónde voy para aprender más sobre la naturaleza de la humanidad a través de nuestra comprensión de la inteligencia artificial?

¿Por qué el enfoque bayesiano es más popular hoy en día que Fuzzy Logic?

Cómo verificar si una respuesta a una pregunta es correcta comparando con una respuesta correcta a la pregunta

¿Por qué entraste en el campo de la IA?

¿Cuál será el mejor algoritmo para encontrar el camino más corto para mover un robot de un punto a otro, cuando varios robots se mueven en un campo?

¿Cuáles son algunos proyectos básicos de robótica que puedo hacer?

¿Por qué los ingenieros de software franceses son tan buenos en las competiciones de IA?

¿La inteligencia artificial (IA) superará a los traductores humanos para 2024?