Cómo mejorar en Machine Learning y PNL

Antes de comenzar su investigación en Machine Learning y PNL, es posible que desee saber qué es lo que más le interesa, si desea ser un desarrollador de aplicaciones o un investigador en el área temática. Dependiendo de su elección, hay algunos requisitos previos. Para involucrarse en la investigación en Ciencias de datos centrales, Aprendizaje automático o Sistemas de inteligencia por ejemplo, debe saber:

  • Álgebra lineal básica – UTAustinX: Álgebra lineal – Fundamentos a las fronteras
  • Experiencia de programación – Introducción a la informática en Udacity, ylearnpythonthehardway.org
  • Estadísticas y probabilidad – MITx: Introducción a la probabilidad; UC BerkeleyX: STAT2.1x: Introducción a la estadística; KIx: Explore las estadísticas con R
  • Cálculo multivariante

Una vez hecho esto, tendría una base matemática lo suficientemente sólida como para trabajar en el campo, ahora puede comenzar tomando

  • El curso de aprendizaje automático de Andrew Ng (YOUTUBE): recomendaría no tomar el curso en Coursera porque los videos de las conferencias no son matemáticamente lo suficientemente desafiantes para que uno realmente entienda los conceptos. (Especialmente cuando ya has tomado los cursos mencionados). Lista de reproducción de conferencias | Aprendizaje automático (Stanford)
  • (Adicional) Lectura asistida –
    • Reconocimiento de patrones y aprendizaje automático de Bishop
    • El razonamiento bayesiano y el aprendizaje automático de David Barber
    • El aprendizaje automático de Kevin Murphy: una perspectiva probabilística
  • Procesamiento natural del lenguaje –

IMPLEMENTANDO SU CONOCIMIENTO: CODIFICACIÓN

  • Tener una sólida comprensión del idioma con el que está trabajando y de las principales bibliotecas y marcos. Como usa Python, debe conocer el uso de bibliotecas estándar y bibliotecas científicas como SciPy y NumPy.
  • Intente implementar todos los modelos desde cero. Debe reinventar la rueda para hacer una mejor . La implementación eficiente de los modelos ML es de rigor . Si no puede, tome algunos cursos como Pensamiento algorítmico, Introducción a los algoritmos o cualquiera de estos.
  • Una vez, implementa todos los modelos de manera eficiente y realmente comprende con qué está jugando. Debería comenzar a usar marcos como TensorFlow, OpenNLP, etc.

No tomes el camino corto. A menos que no entienda las matemáticas o los “algoritmos”, tendrá dificultades para comprender los trabajos de investigación. Y a menos que los comprenda, no podrá implementarlos. Además, manténgase actualizado con la comunidad, lea trabajos de investigación sobre

  • Journal of Machine Learning Research
  • Conferencia conjunta internacional sobre redes neuronales (IJCNN 2017)
  • Google Machine Intelligence
  • HackerNews (Plataforma de debate)

Como cebo, es posible que desee leer esta “Introducción al aprendizaje automático para desarrolladores”

Gracias por A2A

¡Lo mejor de tu investigación!

A2A.

Escribir código no es un gran objetivo a largo plazo. Los programas son una expresión de los algoritmos que piensas. Por lo tanto, para mí, en lugar de limitarse a la codificación de ML, puede ser mejor tener un objetivo más largo de idear nuevos algoritmos e ideas para ML, y aplicaciones interesantes y útiles de ML. Luego, la codificación se convierte en un trampolín para lograr eso

Desde la perspectiva anterior, así es como uno puede mejorar sus habilidades en ML y NLP:

  1. Lee muchos trabajos de investigación.
  2. Sigue blogs.
  3. Ir a través de video cursos y conferencias en línea.
  4. Implemente (algunos) algoritmos importantes usted mismo.
  5. Desarrolle algunas aplicaciones geniales que usan ML y análisis de datos.

Los puntos anteriores no necesitan ser seguidos uno tras otro. Los puntos 2 y 3 pueden ser buenos pasos iniciales.

¿Todavía quieres restringir a Python y ML? Puede elegir una biblioteca como Tensorflow, explorarla y contribuir de nuevo a ella. Check Google lanza Deep Learning con TensorFlow MOOC.

Al hacer yo diría. Vale la pena considerar las competiciones de Kaggle. Las tareas de MOOC (Cousera, Udacity, etc.) son un desafío si eres un principiante.

More Interesting

¿Por qué se usaría H2O.ai sobre la herramienta de aprendizaje automático scikit-learn?

Cómo preprocesar el conjunto de datos de correo electrónico de Enron

¿Cómo detectamos las anamolias que causan la caída de la máquina y la pérdida de producción en la fabricación?

¿Cuáles son algunos ejemplos de empresas no tecnológicas que crean valor a través del uso de Big Data y qué tecnologías específicas están utilizando, por ejemplo, Hadoop, sistemas dedicados, SAP en formas novedosas, piratas informáticos, etc.

¿Cuál es el significado de la optimización convexa en el aprendizaje automático?

¿Cómo podemos minimizar el tiempo de inactividad de la GPU cuando utilizamos TensorFlow?

¿Cuáles son las ventajas y desventajas de cada método de regresión no lineal existente?

¿Qué temas del conjunto de datos son buenos para interactuar?

¿Qué criterios deberían ser apropiados para terminar el entrenamiento codicioso no supervisado de autoencoder por capas?

¿Puede un contador estar completamente automatizado para 2030? Si es así, ¿cuál es la mejor manera de salvar mi trabajo?

¿Cuáles son los algoritmos más populares utilizados en redes neuronales convolucionales?

Cómo demostrar que minimizar la suma residual de cuadrados es equivalente a maximizar la función de log-verosimilitud

¿Cómo se puede usar una distribución como una característica para la clasificación en el aprendizaje automático?

Tengo problemas para mejorar el rendimiento de mi red neuronal a medida que aumento el número de unidades, ¿cuál podría ser el problema?

¿Qué algunos documentos sobre desafíos en predicción financiera con técnicas de aprendizaje automático?