¿Qué cosas debo saber antes de realizar una disertación en aprendizaje automático?

Además de las respuestas más obvias de un buen nivel de Matemáticas (incluyendo estadísticas, probabilidad, álgebra lineal, matrices e idealmente cálculo) y un buen nivel de programación, sugeriría los siguientes detalles:

  • Obtenga experiencia práctica si aún no lo ha hecho. Una forma de hacerlo es concursos de Kaggle (Ir de Big Data a Big Analytics);
  • Dedique tiempo a comprender cómo mejorar los modelos, es decir, saber si tiene un problema de alto sesgo o de alta varianza y cuáles son los cambios adecuados para tratar de acuerdo con esto (es decir, no solo suponga que necesita recopilar más ejemplos de capacitación, etc.);
  • Comprenda qué tipos de algoritmos se utilizan para qué tipos de problemas, por ejemplo, clasificadores, modelos de regresión, aprendizaje supervisado / no supervisado, aprendizaje en línea, etc.

Estoy seguro de que hay muchas otras cosas, pero lo anterior sería un buen comienzo. Si aún no ha cubierto todas estas materias, le recomiendo que consulte el curso Courera del Prof. Andrew Ng sobre Machine Learning: Coursera (puede prever las conferencias para tomar partes del curso fuera de su ciclo normal).

Los estudiantes de doctorado y graduados, especialmente aquellos que no están capacitados como estadísticos, pueden tener dificultades para comprender las estadísticas básicas y avanzadas necesarias para analizar los datos para una disertación en sus áreas temáticas específicas. No obstante, el análisis de datos es una parte esencial de su disertación, ya que le permite interrogar y presentar sus datos de la manera más adecuada para responder las preguntas de investigación en su disertación. Por lo tanto, es posible que necesiten ayuda con las estadísticas de tesis para elegir la técnica correcta para el análisis de datos y obtener ayuda para interpretar los resultados del análisis en contexto y de manera adecuada.

Nota: Esta respuesta contiene cosas muy importantes y semi importantes para saber:

1. Probabilidad y estadística, y lo más importante, estadísticas bayesianas.
2. Reconocimiento de patrones, muy similar a MAchine Learning pero no está en Data Mining (matemática) en lugar de algoritmo.
3. Aprendizaje automático.
4. Computación distribuida.
5. Procesamiento del lenguaje natural (depende del trabajo en la empresa)

Ahora, llegando al software que uno necesita saber:
1. Python: Scipy, Numpy, Scikit-learn, statsmodels, patsy, theano, etc. son algunas bibliotecas imprescindibles. Cuanto más agregue, más equipado estará.
2. R
3. Aprende Julia / Scala / Go si tienes tiempo. Están creciendo rápidamente en este dominio.
4. Java básico para computación distribuida. (Hadoop, Pig, Spark, etc.)
5. Weka – para sistemas de recomendación.

Practica en Kaggle. Incluso si no es Kaggle, practique con algún conjunto de datos que tenga a mano. Esto ayuda a que sus manos se pongan en marcha y también a controlar las herramientas mencionadas anteriormente.

Álgebra lineal, Estadística, Probabilidad y combinación y poco de optimización y cálculo.

Probabilidades y estadísticas.

More Interesting

Quiero hacer un doctorado en áreas relacionadas con la inteligencia artificial en los Estados Unidos. ¿Es muy difícil obtener financiación completa?

¿Puede la inteligencia artificial crear otra inteligencia artificial más inteligente que todas las inteligencias artificiales?

¿Por qué hablamos de robots e inteligencia artificial que toman nuestros trabajos, cuando todo lo que existe son algoritmos e inteligencia de máquina rudimentaria?

¿En qué tipo de aprendizaje automático (supervisado, no supervisado, refuerzo) se podría clasificar la predicción de rama?

¿En qué áreas podrían ser realmente útiles los robots humanos?

Cómo interpretar los resultados de la red neuronal

Total War (serie de juegos): ¿Cuáles son los mayores defectos en la IA de Total War?

¿Cuál es la explicación simple del algoritmo M5P (árboles modelo M5) en aprendizaje automático / minería de datos?

¿Qué debe saber el laico sobre el aprendizaje automático?

¿Por qué tanta gente margina el papel de la inteligencia artificial a largo plazo?

¿Necesito saber Machine Learning antes de estudiar Deep Learning?

¿Cuáles son algunas de las cosas más sorprendentes que pueden hacer las redes neuronales?

¿Por qué la memoria en las redes neuronales no está contenida en los nodos individuales de cada red neuronal?

¿Por qué es importante enfatizar que el agente afecta el medio ambiente en el aprendizaje por refuerzo (RL)?

¿Podría ser científicamente posible transferir nuestra conciencia a cuerpos robóticos?