¿Cuál es el mapa de ruta para un chico universitario para una carrera de aprendizaje automático y competir en Kaggle?

Gracias por A2A,

En primer lugar, Kaggle no es solo una competencia de aprendizaje automático, también debe tener muchos otros conocimientos, sino que ya ha pedido el ‘Mejor mapa de ruta para el aprendizaje automático’, luego siga cuidadosamente la siguiente respuesta.

Hace unos años estaba luchando en el campo de ML como cualquier cosa. Quora no era famosa esa vez, pero google me ayudó de muchas maneras. Me gustaría darle el ‘mantra’ que había seguido para comenzar con Machine Learning.

Primero, comprendamos por qué requerimos conocimiento de ML en el mundo de la ciencia de datos:

ML es el jugador principal en Predictive Analytics. En el análisis predictivo, dependemos principalmente de experimentos pasados, datos pasados o resultados. En términos simples, podríamos decir que ML nos está ayudando a predecir algo accediendo a datos pasados.
Si desea que su producto aprenda algo de los datos que generan los usuarios, esto puede lograrse mediante algoritmos ML.

Como mencionó acerca de su competencia en Java y Python. Yo diría que será un paseo para ti. La pregunta principal aún existe: ¿Cómo empiezo?

Aquí he creado una fórmula para que entiendas que es un requisito previo:

ML = Matemáticas + Estadística + Conocimiento de programación + Estructura de datos y algoritmos

Las matemáticas son muy necesarias si desea ingresar al campo de ML. Aquí la mayoría de las personas / estudiantes se confunden. ¿Cuántas matemáticas se requieren? Bueno, no necesitas ser un maestro de todos y cada uno de los conceptos. Lo que voy a mencionar es lo que ya has aprendido. Por lo tanto, no debe tener miedo, ya que no está aprendiendo algo nuevo y un vasto concepto de matemáticas. Debe tener conocimiento de ‘Álgebra lineal’ y ‘Cálculo’ (aunque no en profundidad). Puede repasar sus conocimientos aquí: Álgebra lineal | Academia Khan y Cálculo | academia Khan
La estadística se considera como el alma de la ciencia de datos. No importa lo que hagas en este campo sin tener conocimiento de estadísticas, eres Big Zero. Aquí puede aprender temas importantes de estadística: Estadísticas y probabilidad | academia Khan
El conocimiento de programación es necesario para manipular los datos e implementar el aprendizaje automático en su producto. Aquí tiene dos opciones, una con ‘Python’ y otra con ‘R’. La elección es suya, pero como ha preguntado aquí, le sugiero que elija ‘Python’. (Además, apunte aquí, ya que es competente en Python) Todavía estoy buscando repasar: Python
El siguiente paso es practicar el algoritmo ML usando Python. Visite aquí: scikit-learn: aprendizaje automático en Python para practicar más.

Estos son requisitos previos para que los novatos comiencen con Machine Learning. Además de eso, puede asistir al curso ML ‘Andrew NG’ en YouTube. Aquí está el enlace: Colección de conferencias | Aprendizaje automático

Solo hay 10 (¡Sí! Solo 10) la mayoría de los algoritmos en ML que se usan en las industrias. Estoy proporcionando la lista de estos algoritmos. Aqui tienes:

C4.5 (árboles de decisión)
k-medias (agrupamiento)
Máquinas de vectores de soporte (SVM)
A priori
Maximización de Expectativas (EM)
Rango de página
AdaBoost
Vecinos k-más cercanos (kNN)
Bayes ingenuos
Árbol de clasificación y regresión (CARRITO)

Para más: los 10 mejores algoritmos de aprendizaje automático

Si necesita más ayuda, no dude en enviarme un mensaje.

(La respuesta anterior es parte de: la respuesta de Akash Dugam a ¿Cómo comienza un principiante total a aprender el aprendizaje automático?)

KaggleMachine Learning

Aprendizaje automático: al construir un modelo de regresión lineal, ¿cómo decido entre variar el grado del polinomio y variar el parámetro de regularización?

¿Qué algoritmos son buenos para usar en el procesamiento del lenguaje natural?

¿Podemos agregar la capa SVM como capa inferior en la arquitectura CNN para una mejor clasificación?

Si quiero trabajar en Machine Learning e Inteligencia artificial, ¿debería especializarme en Matemáticas / CS o Estadísticas / CS?

¿Cómo funciona realmente el Detector MultiBox Single-Shot (SSD)?

Según Wikipedia, las redes neuronales artificiales actuales tienen la complejidad del cerebro de un gusano. ¿Es eso cierto?

Gracias por A2A.

La respuesta de Abhishek Dubey a He hecho B.Tech IT y MBA.Trabajando como profesor. ¿Quiere aprender el aprendizaje automático y obtener un trabajo mejor remunerado? ¿Puedo aprender yo mismo o un curso regular?

Pero tenga un objetivo a largo plazo para terminar de leer este libro una vez:

Reconocimiento de patrones y aprendizaje automático por Christopher Bishop

Pranav Padmasali

La hoja de ruta dependerá de los antecedentes educativos y la experiencia profesional que tenga actualmente. Si eres estudiante de CS y tomaste muchos cursos de ML como estudiante universitario, puedes solicitar puestos de trabajo que utilizan el conocimiento de ML que tienes en este momento. Cuantos más cursos haya tomado en matemáticas, estadísticas e informática (y, en menor medida, física y otras áreas de ingeniería), mejor preparado estará. Es importante tener conocimiento de los fundamentos del álgebra lineal numérica, la optimización y el diseño de algoritmos para comprender algunos de los desarrollos más recientes en áreas como el aprendizaje profundo.

Si no tiene mucha experiencia en CS o ML, una maestría puede ser una buena manera de desarrollar las habilidades que necesita.

Hay varios otros cursos en Coursera y otras plataformas MOOC (por ejemplo, el curso de Geoffrey Hinton en redes neuronales) que sería genial tomar después de terminar el curso de Andrew Ng.

Pranav Padmasali

No hay impedimento para que no entres al concurso de Kaggle. Puede que no seas competitivo, pero aún obtienes un conjunto de datos gratuito para jugar, piensa en ellos como la tarea de Andrew. Incluso si no obtuviste el primer lugar, todavía se ven bien en tu currículum.

Por supuesto, es posible que desee prepararse más. Tomé la clase de Andrew hace cuatro años. Según mi memoria, algunas de las partes que faltan del curso incluyen, sistema de recomendaciones, árbol de decisiones, CNN, aprendizaje profundo y aprendizaje de refuerzo. Estos son algunos de los hotcakes en la comunidad de investigación, así como en la industria. Leer algunos materiales en esos algoritmos te ayudará enormemente. En cuanto a los enlaces en el siguiente paso, simplemente revise algunas de las “preguntas relacionadas” en quora, estoy seguro de que lo encontrará.

Si desea iniciarse en una carrera de ML, apunte a obtener una pasantía de líderes de la industria o solicite las mejores escuelas de posgrado. Intenta mantenerte cerca de tu objetivo (ser ese experto en ML) en el camino.

Pranav Padmasali

No lo hagas complicado. Si le encanta el aprendizaje automático, comience a practicar (analice algunos ejemplos, intente una competencia fácil de Kaggle) y cometa errores. Aprende de tus errores. Aprende un poco de álgebra lineal. Intenta proyectos más difíciles. Aprenda cómo los métodos que le gustan realmente funcionan bajo el capó. Aprenda los supuestos ocultos de los enfoques comunes y cómo puede fallar en la práctica. Todo esto lleva mucho tiempo. Quizás estudiar para obtener un título de maestría puede darte esta vez.

Mostafa Ali Mansour

La mejor manera de prepararse para la carrera de aprendizaje automático es: www. machinelearningmastery .com /

Mostafa Ali Mansour

More Interesting

Cómo extender una red neuronal profunda que se capacitó en la inclusión de palabras en inglés como entrada en una tarea de clasificación a multilingüe

Tengo un conjunto de datos con 14 características. Quiero aplicar SVM en él usando R. ¿Cómo puedo?

En la capacitación de CNN, ¿también se actualizan los pesos correspondientes al mapa de características?

¿Tiene sentido la regularización (L2, abandono, etc.) alguna vez para datos muy ruidosos, pero también abundantes, como series de tiempo financieras?

¿Cuál sería un enfoque razonable para optimizar los ingresos publicitarios del sitio web utilizando datos de GA y aprendizaje automático?

¿Dónde empiezo a aprender reconocimiento de imágenes con algoritmos de aprendizaje automático?

¿Cuáles son algunos proyectos interesantes de minería de texto en análisis político?

En la regresión logística multinomial, ¿por qué el valor p en la prueba de razón de probabilidad es significativo pero en las estimaciones de parámetros no es significativo para cada dimensión?