Cómo prepararse para una entrevista de ciencia de datos o aprendizaje automático en una gran empresa tecnológica

He estado en entrevistas de ciencia de datos y aprendizaje automático, tanto con éxito como sin éxito.

Aprendizaje automático

Si la entrevista es para un papel como ingeniero de software con énfasis en el aprendizaje automático o como ingeniero de aprendizaje automático, sus preparativos deben ser dobles.

  1. Debe estar preparado para enfrentar las mismas preguntas que surgirían en una entrevista normal de ingeniería de software. Es decir, debería ser capaz de manejar un desafío de programación centrado en algoritmos y estructuras de datos. El lenguaje de programación suele ser de su elección.
  2. Debe estar preparado para responder preguntas técnicas detalladas sobre cualquier algoritmo de aprendizaje automático. Además, podría recibir problemas de casos relacionados con desafíos reales en los que la empresa está trabajando y se le pedirá que describa en detalle cómo los resolvería.

Ciencia de los datos

Si la entrevista es para un puesto de ciencia de datos, debe estar preparado para hablar sobre los problemas que ha resuelto en el pasado y sobre cómo la toma de decisiones basada en datos se relaciona con los negocios. Estas entrevistas generalmente no son tan técnicas como las de aprendizaje automático.

Los desafíos para llevar a casa son más comunes en las entrevistas de ciencia de datos. Los desafíos suelen llevar mucho tiempo y, en muchos casos, son ambiguos. A menudo es difícil saber qué tipo de respuestas buscan los entrevistadores. Solo puedes ser bueno en esto con la práctica.

Hay varios recursos en estos días que lo ayudan a prepararse para una entrevista de ciencia de datos / ML.

Lo primero: debes preparar bien lo básico. Estos son los conceptos en torno a diferentes tipos de ML (modelos supervisados, no supervisados, de refuerzo, generativos, especialmente redes neuronales generativas, etc.),

  • variación de sesgo o sobreajuste-sobreajuste,
  • recuperación de precisión,
  • matriz de confusión,
  • Puntuación F (o medida)
  • ¿Cuáles son las diferencias entre el aprendizaje automático generativo y el discriminativo?
  • Cómo manejar los datos de entrenamiento desequilibrados (datos de entrenamiento sesgados a favor de una clase como en los conjuntos de datos médicos)
  • Cómo usar datos no etiquetados (consulte la literatura sobre máquinas de boltzman restringidas)

Además , este enlace puede ayudarlo a prepararse con las preguntas de la entrevista. Tenía este marcador hace mucho tiempo. No estoy seguro de lo útil que es hoy: 40 preguntas de entrevista para ML y Data Science.

Otro enlace que encontré útil para el conocimiento y los recursos es: Cómo conseguir un trabajo en aprendizaje profundo. Esto tiene una breve descripción de las redes neuronales / aprendizaje profundo, enlaces a libros, cursos, bibliotecas, etc.

Me gusta el blog de colah, wildml, fastml y kdnuggets, el blog de Karpathy, OpenAI y su blog para estar en contacto con lo último. También es posible que desee seguir los identificadores de Twitter de estos sitios. Creo que ahora debería agregarse Home – Google.ai a esta lista.

Las grandes empresas tecnológicas tienden a centrarse más en las habilidades de software que en el conocimiento profundo del aprendizaje automático, a menos que sea un ingeniero de aprendizaje automático / posición de I + D. La ciencia de datos probablemente implicará mucha codificación; el aprendizaje automático podría implicar el diseño de un algoritmo para resolver un problema o explicar las matemáticas / algoritmo en profundidad.

Supongo que es su primera posición de DS, y que es para una posición junior / normal que no debería requerir que pueda hacer cálculos de cápsulas en la pizarra.

Además de sentirse cómodo con las preguntas detalladas y complicadas que puede encontrar al buscar en Google las preguntas de la entrevista DS, diría que debe llegar a las presentaciones de los equipos que han ganado las competencias de Kaggle, y tratar de comprender lo que significan cuando explican sus razones para hacerlo y eso y por qué eligieron no hacer esto y aquello.

Lea y obtenga tantos como pueda y tendrá una idea de las preguntas abiertas como “describir cómo resolvería este problema” o “motivarlo para que elija la solución A en lugar de B aquí”, que a menudo son Es muy importante ver si puede hacer un pensamiento abstracto y defender los pros y los contras de las diferentes soluciones en diferentes situaciones.