¿Cuál es el mapa de ruta para un chico universitario para una carrera de aprendizaje automático y competir en Kaggle?

Gracias por A2A,

En primer lugar, Kaggle no es solo una competencia de aprendizaje automático, también debe tener muchos otros conocimientos, sino que ya ha pedido el ‘Mejor mapa de ruta para el aprendizaje automático’, luego siga cuidadosamente la siguiente respuesta.

Hace unos años estaba luchando en el campo de ML como cualquier cosa. Quora no era famosa esa vez, pero google me ayudó de muchas maneras. Me gustaría darle el ‘mantra’ que había seguido para comenzar con Machine Learning.

Primero, comprendamos por qué requerimos conocimiento de ML en el mundo de la ciencia de datos:

  • ML es el jugador principal en Predictive Analytics. En el análisis predictivo, dependemos principalmente de experimentos pasados, datos pasados ​​o resultados. En términos simples, podríamos decir que ML nos está ayudando a predecir algo accediendo a datos pasados.
  • Si desea que su producto aprenda algo de los datos que generan los usuarios, esto puede lograrse mediante algoritmos ML.

Como mencionó acerca de su competencia en Java y Python. Yo diría que será un paseo para ti. La pregunta principal aún existe: ¿Cómo empiezo?

Aquí he creado una fórmula para que entiendas que es un requisito previo:

ML = Matemáticas + Estadística + Conocimiento de programación + Estructura de datos y algoritmos

  1. Las matemáticas son muy necesarias si desea ingresar al campo de ML. Aquí la mayoría de las personas / estudiantes se confunden. ¿Cuántas matemáticas se requieren? Bueno, no necesitas ser un maestro de todos y cada uno de los conceptos. Lo que voy a mencionar es lo que ya has aprendido. Por lo tanto, no debe tener miedo, ya que no está aprendiendo algo nuevo y un vasto concepto de matemáticas. Debe tener conocimiento de ‘Álgebra lineal’ y ‘Cálculo’ (aunque no en profundidad). Puede repasar sus conocimientos aquí: Álgebra lineal | Academia Khan y Cálculo | academia Khan
  2. La estadística se considera como el alma de la ciencia de datos. No importa lo que hagas en este campo sin tener conocimiento de estadísticas, eres Big Zero. Aquí puede aprender temas importantes de estadística: Estadísticas y probabilidad | academia Khan
  3. El conocimiento de programación es necesario para manipular los datos e implementar el aprendizaje automático en su producto. Aquí tiene dos opciones, una con ‘Python’ y otra con ‘R’. La elección es suya, pero como ha preguntado aquí, le sugiero que elija ‘Python’. (Además, apunte aquí, ya que es competente en Python) Todavía estoy buscando repasar: Python
  4. El siguiente paso es practicar el algoritmo ML usando Python. Visite aquí: scikit-learn: aprendizaje automático en Python para practicar más.

Estos son requisitos previos para que los novatos comiencen con Machine Learning. Además de eso, puede asistir al curso ML ‘Andrew NG’ en YouTube. Aquí está el enlace: Colección de conferencias | Aprendizaje automático

Solo hay 10 (¡Sí! Solo 10) la mayoría de los algoritmos en ML que se usan en las industrias. Estoy proporcionando la lista de estos algoritmos. Aqui tienes:

  1. C4.5 (árboles de decisión)
  2. k-medias (agrupamiento)
  3. Máquinas de vectores de soporte (SVM)
  4. A priori
  5. Maximización de Expectativas (EM)
  6. Rango de página
  7. AdaBoost
  8. Vecinos k-más cercanos (kNN)
  9. Bayes ingenuos
  10. Árbol de clasificación y regresión (CARRITO)

Para más: los 10 mejores algoritmos de aprendizaje automático

Si necesita más ayuda, no dude en enviarme un mensaje.

(La respuesta anterior es parte de: la respuesta de Akash Dugam a ¿Cómo comienza un principiante total a aprender el aprendizaje automático?)

Gracias por A2A.

La respuesta de Abhishek Dubey a He hecho B.Tech IT y MBA.Trabajando como profesor. ¿Quiere aprender el aprendizaje automático y obtener un trabajo mejor remunerado? ¿Puedo aprender yo mismo o un curso regular?

Pero tenga un objetivo a largo plazo para terminar de leer este libro una vez:

Reconocimiento de patrones y aprendizaje automático por Christopher Bishop

La hoja de ruta dependerá de los antecedentes educativos y la experiencia profesional que tenga actualmente. Si eres estudiante de CS y tomaste muchos cursos de ML como estudiante universitario, puedes solicitar puestos de trabajo que utilizan el conocimiento de ML que tienes en este momento. Cuantos más cursos haya tomado en matemáticas, estadísticas e informática (y, en menor medida, física y otras áreas de ingeniería), mejor preparado estará. Es importante tener conocimiento de los fundamentos del álgebra lineal numérica, la optimización y el diseño de algoritmos para comprender algunos de los desarrollos más recientes en áreas como el aprendizaje profundo.

Si no tiene mucha experiencia en CS o ML, una maestría puede ser una buena manera de desarrollar las habilidades que necesita.

Hay varios otros cursos en Coursera y otras plataformas MOOC (por ejemplo, el curso de Geoffrey Hinton en redes neuronales) que sería genial tomar después de terminar el curso de Andrew Ng.

No hay impedimento para que no entres al concurso de Kaggle. Puede que no seas competitivo, pero aún obtienes un conjunto de datos gratuito para jugar, piensa en ellos como la tarea de Andrew. Incluso si no obtuviste el primer lugar, todavía se ven bien en tu currículum.

Por supuesto, es posible que desee prepararse más. Tomé la clase de Andrew hace cuatro años. Según mi memoria, algunas de las partes que faltan del curso incluyen, sistema de recomendaciones, árbol de decisiones, CNN, aprendizaje profundo y aprendizaje de refuerzo. Estos son algunos de los hotcakes en la comunidad de investigación, así como en la industria. Leer algunos materiales en esos algoritmos te ayudará enormemente. En cuanto a los enlaces en el siguiente paso, simplemente revise algunas de las “preguntas relacionadas” en quora, estoy seguro de que lo encontrará.

Si desea iniciarse en una carrera de ML, apunte a obtener una pasantía de líderes de la industria o solicite las mejores escuelas de posgrado. Intenta mantenerte cerca de tu objetivo (ser ese experto en ML) en el camino.

No lo hagas complicado. Si le encanta el aprendizaje automático, comience a practicar (analice algunos ejemplos, intente una competencia fácil de Kaggle) y cometa errores. Aprende de tus errores. Aprende un poco de álgebra lineal. Intenta proyectos más difíciles. Aprenda cómo los métodos que le gustan realmente funcionan bajo el capó. Aprenda los supuestos ocultos de los enfoques comunes y cómo puede fallar en la práctica. Todo esto lleva mucho tiempo. Quizás estudiar para obtener un título de maestría puede darte esta vez.

La mejor manera de prepararse para la carrera de aprendizaje automático es: www. machinelearningmastery .com /

More Interesting

Cómo extender una red neuronal profunda que se capacitó en la inclusión de palabras en inglés como entrada en una tarea de clasificación a multilingüe

Tengo un conjunto de datos con 14 características. Quiero aplicar SVM en él usando R. ¿Cómo puedo?

En la capacitación de CNN, ¿también se actualizan los pesos correspondientes al mapa de características?

¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?

¿Cuál sería un enfoque razonable para optimizar los ingresos publicitarios del sitio web utilizando datos de GA y aprendizaje automático?

¿Dónde empiezo a aprender reconocimiento de imágenes con algoritmos de aprendizaje automático?

¿Cuáles son algunos proyectos interesantes de minería de texto en análisis político?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?

¿Cuántos parámetros deben ajustarse para Random Forest?

¿El sobreajuste en un conjunto de datos implica que el modelo realmente puede aprender y generalizar sobre ese conjunto de datos, pero desafortunadamente demasiado entrenado?

¿Qué algoritmo sería bueno para asignar una probabilidad a la coincidencia de dos nombres (John Doe = Mr. Jonathan M Doe II)?

¿Qué se considera estado de arte para la traducción automática neuronal?

¿Desde dónde puedo aprender la implementación del aprendizaje automático en Python?

¿Cómo se recupera la información de las cajas negras?

¿Cuáles son algunas redes neuronales diferentes que podrían usarse como algoritmos de control en cuadricópteros autónomos?