¿Cuáles son los algoritmos más populares utilizados en redes neuronales convolucionales?

De mi breve investigación sobre el aprendizaje profundo , parece que un enfoque de red neuronal convolucional (CNN) es lo más avanzado , especialmente en reconocimiento visual . Por ejemplo, vea este documento. Este enfoque es especialmente interesante a la luz de la reciente incorporación de cuDNN de la biblioteca CNN de bajo nivel basada en GPU de NVIDIA a su oferta CUDA (se integra con las bibliotecas de aprendizaje profundo de código abierto Caffe, Torch y Theano): Página en gputechconf.com. El enfoque CNN se caracteriza por una muy alta precisión de reconocimiento. Del mismo modo, se logra una alta precisión mediante el uso de un enfoque PCA profundo alternativo . Además, me gustaría compartir las siguientes dos bonitas colecciones de recursos , centradas en el aprendizaje profundo y el reconocimiento visual , correspondientemente: DeepLearning.University: una bibliografía anotada de aprendizaje profundo, así como recursos. Me doy cuenta de que esta no es una respuesta directa a la pregunta, pero espero que los recursos, mencionados anteriormente, sean útiles para responderla.

Por “algoritmo”, ¿quiere decir “arquitectura / modelo” o “algoritmo de optimización”? Digo esto porque la forma general del algoritmo CNN es siempre la misma: alimentar datos, procesar en capas, luego alimentar pérdidas y procesar hacia atrás.

Si te refieres a “arquitectura / modelo”, algunos famosos para echar un vistazo son LeNet, AlexNet, ResNet y VGG. Lo que difiere entre estos algoritmos es el número de capas, el ancho de zancada / parche de los filtros convolucionales, los tipos de agrupación y no linealidad, y las posibles conexiones de omisión.

Si quiere decir “algoritmo de optimización”, busque en el descenso de gradiente estocástico (casi siempre usado en lugar del descenso de gradiente de vainilla), Adam y Adadelta.

Eche un vistazo a LeNet, la contribución de Yann LeCun, si aún no ha oído hablar de ello: MNIST Demos en el sitio web de Yann LeCun
La versión de Google de esto ganó un prestigioso concurso de identificación de imágenes el año pasado.

More Interesting

Cómo desarrollar software que se afinará

¿Cuál sería un buen enfoque de aprendizaje automático para un bot de comercio de criptomonedas con aproximadamente media docena de parámetros de entrada de estrategia de comercio numérico y una salida numérica (porcentaje de ganancia diaria)? Todos los días el modelo probaría nuevos parámetros.

Cuál debería ser mi próximo paso, después de cubrir las estadísticas básicas de las estadísticas principales, un curso básico de análisis de datos (preparación de datos, exploración, clasificación, minería de reglas de asociación, agrupación, regresión) y un proyecto en un conjunto de datos SSLC (puede encontrarlo en mi único blog en Quora) usando R?

¿Qué es Kaggle y cómo debo usarlo exactamente?

¿Existen trabajos de Ciencia de datos y Aprendizaje automático para estudiantes de primer año en India?

¿Por qué usamos convolución en redes neuronales?

¿Qué quiere decir con redes neuronales lineales profundas / no lineales?

¿Qué significa realmente el aprendizaje automático en términos reales?

¿Cuáles son los métodos de implementación con calidad de producción para los modelos de aprendizaje automático?

¿Cuál es la ley cero del algoritmo de aprendizaje automático (MLA)?

Cómo construir un automóvil autónomo a partir de un automóvil normal

Cómo lidiar con múltiples resultados mutuamente dependientes en el aprendizaje automático

¿Cuál es el orden jerárquico del universo?

¿Es c # una buena opción para el aprendizaje automático de producción?

En el aprendizaje de características, ¿cuál es la regla general para decidir el número de parches aleatorios y el número de iteraciones / épocas con respecto al número deseado de nodos / longitud de la característica?