Cómo comenzar una investigación independiente en aprendizaje profundo

Es difícil comenzar desde cero de forma independiente pero factible.

Admitamos que no puedes ser completamente independiente donde inventarás todas las cosas que ya existen en la línea comunitaria CNN, funciones de activación, LSTM, etc. Así que de alguna manera tienes que estar en la comunidad para obtener lo mejor de lo que ya es. está ofreciendo.

Ahora como empezar.

  • Primero debe elegir el área problemática para su investigación: visión, habla, etc.
  • Luego debe estudiar todo al respecto desde el principio hasta el final y debe mantenerse al tanto de los últimos documentos, técnicas y avances en ese campo.
  • Luego, debe identificar un área específica entre la que desea abordar (al menos inicialmente), por ejemplo: precisión del modelo, complejidad arquitectónica, profundidad de red, manipulación de salida, etc.
  • Esto probablemente llevará uno o dos años o incluso más, según su capacidad para comprender el concepto y dominar su implementación.
  • Entonces solo usted puede proceder a buscar un posible grupo. Supongo que estás en la academia, así que espero que tengas algunos candidatos potenciales para comenzar.

Algunas cosas a tener en cuenta antes de continuar:

  1. Se requiere absolutamente una comprensión clara e innata de los acontecimientos subyacentes del aprendizaje profundo para realizar cualquier tipo de investigación. Cuestiona todo y deja tus conceptos muy claros de cómo y por qué sucede algo
  2. Las habilidades de programación son necesarias, pero debe tener los conceptos básicos de reconocimiento de patrones como Regresión, Álgebra lineal en su conjunto, el concepto de Tensores, probabilidad, Maximización de expectativas, cosas como esas. Es posible que desee repasar esas habilidades aquí: Deep Learning

Este no es un consejo exhaustivo, sino una buena nota para comenzar.

Espero que tengas éxito en lo que estás buscando y agradezco tus esfuerzos.

Todo lo mejor !

Esto no es fácil de cubrir en unos pocos párrafos.
El aprendizaje automático normal se trata principalmente de reconocimiento de patrones, hasta cierto punto. Pero el aprendizaje real, o el aprendizaje profundo, que implica ir más allá de las meras redes neuronales multinivel, requiere pensar en pensar: ¿cómo formamos conceptos a partir de los datos? qué SON los conceptos: cómo razonamos, no solo reconocemos un patrón. El aprendizaje profundo puede implicar descubrir cómo formar modelos a partir del razonamiento lógico, o cómo crear dinámicamente microarquitecturas optimizadas para aprender algún subdominio, o sobre integrar múltiples vistas de algo en un modelo 3D.
Para hacer una investigación independiente, es posible que desee comenzar examinando la literatura en alguna área que le interese lo suficiente como para motivarse para comenzar y quedarse con un esfuerzo largo y profundo. Vea lo que otras personas han hecho en el área y luego busque problemas no resueltos. Para resolver algunos de ellos, primero debe convertirse en un experto en un área.
No es un camino fácil, pero puede ser interesante y emocionante. Si tiene acceso a una biblioteca universitaria, busque las actas de la conferencia y examine en qué están trabajando otros investigadores. Aproveche lo que dicen que son problemas a resolver.

Hola, te sugiero cuatro pasos:

1: Aprende algunos cursos en línea y lee algunos libros,

  • CS231n: Redes neuronales convolucionales para el reconocimiento visual (disponible en youtube)
  • Curso de aprendizaje profundo de Oxford (disponible en youtube)
  • Redes neuronales para el aprendizaje automático – Universidad de Toronto | Coursera (Coursera)
  • Redes neuronales y aprendizaje profundo (Libro)

2: Familiarícese con una o dos cajas de herramientas DL

Según mi experiencia, sugeriría comenzar un aprendizaje profundo con Keras. Antes, debes saber cómo programar con python. Mientras tanto, una vez que esté familiarizado con los keras, puede intentar continuar aprendiendo Tensorflow. Keras es más fácil de aprender que TF. Pero, creo que estar familiarizado con estas dos cajas de herramientas son complementarias.

3: Paly algunos problemas reales en lugar de algún tutorial

  • Kaggle
  • Gran desafío
  • Competiciones en algunas conferencias importantes (ICCV, CVPR, ECCV)

4: Intenta colaborar con algún investigador o ingeniero experimentado (maestro de Kaggle o profesores académicos)

Personalmente, trabajé más en investigaciones médicas relacionadas con el aprendizaje profundo. Si está interesado, puede ir a grandes desafíos: Inicio y elegir un problema interesante. Sería suficiente para una tesis de maestría, si puede dar una buena solución a cualquiera de los problemas.

More Interesting

¿Cómo cambiará Google Brain el futuro de la búsqueda?

¿Se puede extraer información significativa de datos hash para el aprendizaje automático?

Muchas empresas hablan de 'big data' y 'aprendizaje profundo', y siempre ponen estas etiquetas en sus productos. ¿Cuál es el verdadero significado detrás de esto?

¿Cuál es la diferencia entre ajuste de curva y regresión?

¿Hay algún profesor actual en Asia que tenga un historial con Bayesian no paramétrico, tanto en teoría como en aplicación?

Fuera de Theano, Caffe y DeepLearning4j, ¿hay alguna buena biblioteca de DeepLearning?

¿El sobreajuste es un problema en el aprendizaje de refuerzo profundo?

¿Cuál es la mejor introducción al aprendizaje profundo para un estudiante graduado con experiencia en matemáticas y CS?

Cómo saber que un modelo de similitud de documentos puede lograr un alto rendimiento / mejor calidad que los otros modelos

¿Qué tipo de ciencia de datos o información relacionada con el aprendizaje automático pagaría una empresa?

¿Cuáles son las relaciones entre el aprendizaje de representación y los modelos generativos en el campo de aprendizaje profundo?

¿Puede el aprendizaje profundo predecir los dígitos de Pi?

¿Debo usar un cursor o usar el paquete R directamente?

¿Cómo se pueden usar Hadoop y NoSQL para procesar grandes conjuntos de datos en Java?

¿Cuál es la diferencia entre el análisis factorial y las técnicas de selección de características, como el análisis de componentes principales y la asignación de dirichlet latente?