¿Me puede recomendar algunos conceptos teóricos que sean útiles para el aprendizaje profundo?

El aprendizaje profundo es un concepto relativamente nuevo y aún no se ha estructurado del todo, probablemente porque la gente todavía está tratando de entender y conceptualizar cómo o por qué está proporcionando resultados tan maravillosos en todos los dominios posibles. Es posible que sumergirse directamente en Deep Learning no sea beneficioso, ya que extrañaría muchos conceptos que contribuyeron a su evolución. Para obtener una buena base teórica de Deep Learning, le recomendaría que comience desde lo básico.

El primer paso sería comenzar con los perceptrones y los clasificadores binarios supervisados, su convergencia, sus limitaciones, etc. Le daría una idea básica sobre por qué se requiere la clasificación y las técnicas a través de las cuales se logra. El aprendizaje obtenido de los perceptrones lo ayudará a comprender la necesidad de realizar límites de decisión complejos y la evolución de las redes neuronales, las funciones de activación, etc.

Se puede encontrar una buena base teórica de los conceptos anteriores en el libro, Clasificación de patrones de Duda et al. Además, puede tomar el curso de Redes neuronales para el aprendizaje automático en Coursera por el profesor Geoffrey Hinton.

Después de comprender las operaciones básicas de retroalimentación y la propagación hacia atrás en las ANN, puede continuar aprendiendo sobre algunas redes avanzadas como las Redes neuronales convolucionales (CNN) y las Redes neuronales recurrentes (RNN). Intente centrarse en los conceptos relacionados que intervienen en estos, como los diferentes tipos de capas en CNN (Convolucional, Agrupación y Conexión total), submuestreo en CNN, Gradientes de fuga, Puertas en RNN, Unidades de memoria a largo plazo (LSTM), Compuerta Unidades recurrentes (GRU) y su importancia. Tome los estudios de caso de algunas redes como AlexNet, ZF Net, VGG Net, GoogLeNet, etc. e intente comprender por qué apilar una variedad de capas es mágicamente capaz de clasificar el mundo que nos rodea.

Esto le dará una base básica para el aprendizaje profundo y los conceptos detrás de él, como la regularización, la optimización y el modelado de secuencias. Un gran recurso que recomendaría para lo anterior es el Libro de aprendizaje profundo. Las conferencias sobre Redes neuronales convolucionales para el reconocimiento visual en Stanford CS231n proporcionan una muy buena base para los conceptos antes mencionados. Además, puede ver algunas charlas sobre Deep Learning, como las impartidas por el profesor Andrew Ng en GTC 2015 y NIPS 2016.

Una excelente manera de mantenerse actualizado sobre Deep Learning es leer un montón de documentos y comprender las ideas detrás de la formulación de redes relacionadas.

PD: he dado una descripción completa de cómo abordar el Aprendizaje profundo que podría ser beneficioso para todos. Depende de usted omitir partes, si ya conoce la mayoría de ellas.

More Interesting

¿En qué se diferencia la IA de la coincidencia de patrones básicamente?

Tengo una sólida formación matemática. ¿Qué cursos debo tomar para estudiar el aprendizaje automático?

¿Sería útil para un ingeniero de verificación de diseño de chips aprender aprendizaje automático / IA?

¿Cuál será el impacto de la IA en la industria del marketing?

¿Cuál es la implicación del teorema de aproximación universal sobre la metodología de aprendizaje profundo?

¿Ultron era un poco tonto por la IA?

¿Cuáles son ejemplos de industrias poco atractivas que tienen problemas que podrían resolverse mediante el uso del aprendizaje automático y la inteligencia artificial?

¿Qué algoritmos crean otros algoritmos? ¿Cómo trabajan?

¿Existe algún experimento lo suficientemente avanzado que permita a AI escribir ficción, tal vez basada en una trama? ¿Algún investigador en particular que conoces?

¿Puedo replicar el auto sin conductor de Google como un proyecto de pasatiempo?

Qué tan rápido calcula el cerebro la información visual. ¿Desde la luz llega al ojo hasta la "conciencia" de la impresión? ¿Y cómo viaja la información?

¿Los jugadores de ajedrez tienen diferentes estilos?

¿Hay alguna manera de decidir si una simulación perfecta de todos los aspectos de su estado mental es realmente consciente?

¿Cuáles son los algoritmos de aprendizaje profundo más importantes? ¿En qué orden debo aprenderlos?

¿Cuáles son algunos buenos ejemplos de aplicaciones web que tienen inteligencia artificial?