Cómo conseguir un trabajo de aprendizaje automático en 9 meses

No estas solo mi amigo. Cada día más personas se interesan en el aprendizaje automático. De hecho, sería difícil encontrar un campo que genere más expectación en estos días que este, una cosa está clara: el aprendizaje automático ha llegado.

Antes de entrar en habilidades específicas, hay un concepto más que abordar. Ser ingeniero de Machine Learning requiere comprender todo el ecosistema para el que está diseñando. Comprenda el ecosistema (de lo que sea que esté trabajando) y necesitaría estas habilidades para conseguir un trabajo.

Resumen de habilidades

1. Fundamentos y programación de ciencias de la computación (TRABAJAR TODOS LOS DÍAS)

Los fundamentos informáticos importantes para los ingenieros de Machine Learning incluyen estructuras de datos (pilas, colas, matrices multidimensionales, árboles, gráficos, etc.), algoritmos (búsqueda, clasificación, optimización, programación dinámica, etc.), computabilidad y complejidad (P vs NP, problemas de NP completo, notación big-O, algoritmos aproximados, etc.) y arquitectura de la computadora (memoria, caché, ancho de banda, puntos muertos, procesamiento distribuido, etc.).

Debe poder aplicarlos, implementarlos, adaptarlos o abordarlos (según corresponda) al programar. Los problemas de práctica, las competencias de codificación y los hackatones son una excelente manera de perfeccionar tus habilidades.

2. Probabilidad y estadística

Una caracterización formal de la probabilidad (probabilidad condicional, regla de Bayes, probabilidad, independencia, etc.) y las técnicas derivadas de ella (redes de Bayes, procesos de decisión de Markov, modelos de Markov ocultos, etc.) están en el corazón de muchos algoritmos de Machine Learning; Estos son un medio para hacer frente a la incertidumbre en el mundo real. Estrechamente relacionado con esto está el campo de la estadística, que proporciona varias medidas (media, mediana, varianza, etc.), distribuciones (uniforme, normal, binomial, Poisson, etc.) y métodos de análisis (ANOVA, prueba de hipótesis, etc.) que son necesarios para construir y validar modelos a partir de datos observados. Muchos algoritmos de Machine Learning son esencialmente extensiones de procedimientos de modelado estadístico.

3. Modelado y evaluación de datos

El modelado de datos es el proceso de estimar la estructura subyacente de un conjunto de datos dado, con el objetivo de encontrar patrones útiles (correlaciones, grupos, vectores propios, etc.) y / o predecir propiedades de instancias nunca antes vistas (clasificación, regresión, detección de anomalías, etc. .). Una parte clave de este proceso de estimación es evaluar continuamente qué tan bueno es un modelo dado. Dependiendo de la tarea en cuestión, deberá elegir una medida de precisión / error adecuada (por ejemplo, pérdida de registro para la clasificación, suma de errores al cuadrado para regresión, etc.) y una estrategia de evaluación (división de prueba de entrenamiento, secuencial vs. validación cruzada aleatoria, etc.). Los algoritmos de aprendizaje iterativo a menudo utilizan directamente los errores resultantes para modificar el modelo (por ejemplo, la propagación hacia atrás para redes neuronales), por lo que comprender estas medidas es muy importante incluso para la aplicación de algoritmos estándar.

4. Aplicación de algoritmos y bibliotecas de aprendizaje automático

Las implementaciones estándar de los algoritmos de Machine Learning están ampliamente disponibles a través de bibliotecas / paquetes / API (por ejemplo, scikit-learn, Theano, Spark MLlib, H2O, TensorFlow, etc.), pero aplicarlos de manera efectiva implica elegir un modelo adecuado (árbol de decisión, vecino más cercano, neuronal net, máquina de vectores de soporte, conjunto de modelos múltiples, etc.), un procedimiento de aprendizaje para ajustar los datos (regresión lineal, descenso de gradiente, algoritmos genéticos, embolsado, refuerzo y otros métodos específicos del modelo), así como comprender cómo los hiperparámetros afectar el aprendizaje También debe ser consciente de las ventajas y desventajas relativas de los diferentes enfoques, y las numerosas trampas que pueden hacer que se tropiece (sesgo y varianza, sobreajuste y falta de ajuste, datos faltantes, pérdida de datos, etc.) Los desafíos de la ciencia de datos y el aprendizaje automático, como los de Kaggle, son una excelente manera de exponerse a diferentes tipos de problemas y sus matices.

5. Ingeniería de software y diseño de sistemas

Al final del día, la salida o entrega típica de un ingeniero de Machine Learning es software. Y a menudo es un componente pequeño que encaja en un ecosistema más grande de productos y servicios. Debe comprender cómo funcionan estas diferentes piezas, comunicarse con ellas (mediante llamadas a la biblioteca, API REST, consultas de bases de datos, etc.) y crear interfaces apropiadas para su componente de las que dependerán otros. Puede ser necesario un diseño cuidadoso del sistema para evitar cuellos de botella y permitir que sus algoritmos se escalen bien con el aumento de los volúmenes de datos. Las mejores prácticas de ingeniería de software (incluidos el análisis de requisitos, el diseño del sistema, la modularidad, el control de versiones, las pruebas, la documentación, etc.) son invaluables para la productividad, la colaboración, la calidad y el mantenimiento.

No se trata de obtener un trabajo después de una finalización sucesiva, por supuesto, puede obtener un trabajo en ML incluso en 6 meses o menos. Lo que los empleadores ven en un perfil de candidato es su conjunto de habilidades y qué tan bien lo usa para avanzar en la carga de trabajo. 🙂

No puedo garantizar que obtendrá un trabajo en 9 meses, pero le diré cómo obtener un conocimiento profundo en el campo del aprendizaje automático. Eso definitivamente te ayudará a conseguir un trabajo. Después de todo, conseguir trabajo depende de cuán duro e inteligente trabaje.

Siga los siguientes pasos para convertirse en un experto en aprendizaje automático.

1.Habilidades de programación : actualmente, la programación R y la programación python son los entornos más utilizados para programar en el aprendizaje automático en todo el mundo. Entonces, antes que nada, obtenga algunos conceptos básicos y sintaxis en el entorno en el que desea realizar la programación. Como eres un aprendiz novato, te sugiero que sigas con la programación de Python, ya que es un lenguaje de programación fácil de aprender en lugar de otros lenguajes. Pero ambas herramientas se superan entre sí en diferentes dominios. Si tiene algún conocimiento de programación y desea comenzar con la programación en R, le sugiero que descargue R studio y practique paquetes Swirl , lo ayudará a repasar los conceptos básicos y toda la sintaxis en la programación en R. Puede consultar los siguientes enlaces:

  • Tutoriales de programación de Python 3.4 – YouTube
  • remolino | Estudiantes

2.Estadísticas de aprendizaje : el aprendizaje automático no es más que desarrollar diferentes modelos estadísticos para conjuntos de datos dados. Por lo tanto, debe tener una mejor comprensión de las estadísticas. Le sugeriré el libro Introducción al aprendizaje estadístico que explica muy bien todos los conceptos estadísticos. Además de esto, hay algoritmos de aprendizaje automático que también se explican con sesiones prácticas que utilizan la programación R. Utilizaron diferentes conjuntos de datos para ejecutar diferentes algoritmos. Una vez que haya leído este libro, habrá terminado con el 50% del trabajo en aprendizaje automático. PDF del libro disponible aquí: Introducción al aprendizaje estadístico: con aplicaciones en R – Usc – PDF Drive

3. Algoritmos de aprendizaje automático: una vez que haya terminado con lo anterior, tome el curso en línea de Coursera: Machine Learning | Coursera.

Si no puede obtener un curso en línea, puede encontrar videos tutoriales disponibles en YouTube con el mismo nombre y por el mismo instructor. El instructor de este curso es científico de datos y es uno de los fundadores de Coursera MOOC. Aquí explicó todos los conceptos y algoritmos de aprendizaje automático muy bien con conjuntos de datos en tiempo real en la práctica. Después de este curso, puede terminar con el aprendizaje automático. Pero la parte más importante comienza ahora que es practicar sobre diferentes conjuntos de datos con diferentes algoritmos.

4. Implementación de algoritmos: creo que ahora eres capaz de manejar conjuntos de datos en tiempo real. Puede obtener muchas competiciones y diferentes conjuntos de datos en tiempo real aquí: https://www.kaggle.com . Kaggle es el hogar de la ciencia de datos y el aprendizaje automático. Puede aprender, trabajar y jugar con datos aquí. Te hará más fuerte y es posible que tengas un problema desafiante allí. Cuando atraviesa diferentes problemas, aplique diferentes algoritmos y encuentre algo mejor que pueda llevarlo a algunos trabajos de investigación que son transacciones. Esto definitivamente te ayudará a conseguir un trabajo en este campo.

5. Permanezca conectado a través de LinkedIn: una vez que haya hecho todo lo anterior, su perfil de LinkedIn será demasiado fuerte para luchar contra cualquier otro candidato que se prepare para un trabajo en este campo. Muchas empresas y RR.HH. también buscan un buen perfil en LinkedIn para que te noten. Esto le dará la oportunidad de comenzar su operador.

Así es como puede obtener trabajo en el campo de aprendizaje automático. Pero la pregunta con respecto a 9 meses, depende totalmente de su trabajo duro e inteligencia. Pero una cosa está clara: si sigue el procedimiento anterior, definitivamente se convertirá en un experto en aprendizaje automático.


Trabaja paciente y ardientemente, seguramente tendrás éxito.

Primeros 3 meses:

Aprenda cursos de aprendizaje automático de aprendizaje automático de udemy.

Aprende programación en Python y R.

Aprenda de otros, trabaje en kaggle y comience a trabajar en diferentes conjuntos de datos.

Prepara un buen currículum.

Prepare un buen perfil de GitHub.

Próximo mes:

Después de esto, comience a solicitar pasantías en diferentes sitios y pregunte si hay una oferta de PPO después de completar la pasantía.

Trabaja de 4 a 6 meses dependiendo de la duración de tu pasantía.

Entonces hay posibilidades de conseguir un trabajo remunerado decente.

Si necesita salarios altos en un corto período de tiempo, la mejor manera es participar en varias competiciones de kaggle y hackatones y ganar al menos una competencia.

Te sugiero que sigas este enlace, puedes aprender ML en 90 días. – 3 meses

Practica-Aprende-Practica – 3 meses

Luego, prepare / comience a dar entrevistas durante 3 a 4 semanas, tome preguntas después de cada fracaso de la entrevista y comience a prepararse para las próximas 2 semanas, debe aterrizar en Job pronto. ¡Buena suerte!

More Interesting

Por lo general, en la tercera sección de un artículo describimos el tipo de datos, la fuente de datos, el análisis de datos, etc. ¿Es este un método o una sección de metodología?

¿Qué se puede inferir de esta gráfica de función de autocorrelación con pendiente descendente totalmente positiva?

¿Qué habilidades son necesarias para conseguir un trabajo en análisis de datos?

¿Podría un trabajo en consultoría de Data Science en banca implicar viajes internacionales frecuentes y el salario más alto dentro del campo de Data Science?

A los 28 años, y aprendiendo a programar. ¿Me he perdido la oportunidad de conseguir un trabajo en ciencia de datos y aprendizaje automático en el Reino Unido?

¿Existe alguna certificación de científico de datos en Oracle?

¿Cómo manejaría e investigaría típicamente los valores atípicos en un conjunto de datos?

¿Google Drive se cerrará en un futuro cercano?

¿Cuáles son algunos algoritmos de aprendizaje automático que todo estudiante de informática debe saber?

¿Cuál es el estado actual de Julia, el lenguaje de programación?

¿Cuáles son algunos buenos proyectos sobre aprendizaje automático y minería de datos?

¿A qué proyectos de código abierto relacionados con la ciencia de datos podría contribuir como programador novato?

¿Qué clases de CS son las más importantes para un ingeniero de big data?

¿Necesito ser un analista de datos para obtener un trabajo en el campo de aprendizaje automático?

¿Cuál es una explicación intuitiva para la función de pérdida de registro?