¿Cómo descifrar cualquier entrevista de aprendizaje automático? ¿Qué tipo de preguntas debo esperar? Qué tipos de proyectos paralelos relevantes se verían bien en un CV

Creo que sería difícil prepararse para “cualquier” entrevista de aprendizaje automático sin años de estudio porque el aprendizaje automático es un campo amplio. Sería mucho más eficiente seleccionar un área específica de aprendizaje automático (como aprendizaje profundo o aprendizaje de refuerzo o agrupamiento) y concentrarse en aprobar cualquier entrevista en esa área.

Si desea poder aprobar cualquier entrevista de aprendizaje automático, una opción sería obtener un título como una maestría en aprendizaje automático. Un doctorado será bastante limitado, y es poco probable que obtenga mucho de los años de investigación independiente que se generalizaría en muchas áreas del aprendizaje automático. Por lo tanto, puede inscribirse en dicho programa de maestría o encontrar programas de estudios de posgrado en ML y materiales de estudio sobre dichos programas.

También querrá obtener experiencia en el mundo real con los métodos descritos en los libros y documentos, ya que las entrevistas de ML a menudo implican alguna discusión sobre sus proyectos.

Finalmente, necesitarías estar muy cómodo con la probabilidad y las estadísticas. Con suerte, esto vendría de los cursos de MS, pero también ayudaría haber tomado al menos un curso de probabilidad completa para ser introducido a la intuición probabilística y un curso completo de estadística para ser introducido al pensamiento estadístico.

Para responder subpreguntas en su pregunta original:

¿Qué tipo de preguntas esperar?

Solo estoy inventando esto, pero creo que también son bastante estándar:

  • derivar la ecuación de actualización para regresión lineal
  • ¿Cómo manejas las variables categóricas con regresión lineal?
  • explicar la regresión logística
  • dígame cómo usted (como científico de datos en Foursquare) podría descubrir en qué restaurante se encuentra una persona dado su lat / long.
  • dime que es EM
  • no, en serio, ¿qué objetivo está maximizando EM?
  • ¿Cómo haría la selección de características en tal o cual proyecto?
  • ¿Qué haces cuando tus datos tienen valores faltantes / incorrectos?
  • cuéntame sobre tal o cual proyecto en tu currículum
  • ¿Por qué es importante la convexidad para el aprendizaje de algoritmos?

¿Qué tipo de proyectos paralelos relevantes se verían bien cuando se agreguen en CV?

  • un proyecto en el que tenía que recopilar los datos usted mismo, por ejemplo, eliminar comentarios de productos de un sitio web
  • un proyecto en el que tenía que lidiar con datos faltantes o desordenados, por ejemplo, casos en los que algunas personas proporcionan su ubicación y otras no
  • un proyecto en el que tenías que descubrir una “verdad fundamental” apropiada. tal vez fueron clics; tal vez fueron etiquetas humanas; tal vez fue un método sin supervisión
  • un proyecto donde hay muchos lugares para aplicar el razonamiento estadístico, es decir, no solo una tabla plana de datos
  • un proyecto donde la aplicación del aprendizaje automático está resolviendo un problema importante (puede usar ML en cualquier cosa; si es útil es otra pregunta), por ejemplo, predecir si las personas que describen síntomas en un foro médico eventualmente son diagnosticadas con una enfermedad.

Editado: la pregunta fue editada para excluir explícitamente este tipo de respuesta, pero creo que aún es relevante para aquellos que buscan prepararse para una entrevista.

No lo hagas

Sigo dando la misma respuesta, la mejor manera de pasar una entrevista es estar calificado para el puesto. Si de hecho está calificado para el puesto, un buen entrevistador se dará cuenta de eso. Un buen entrevistador no puede ser engañado, y usted quiere trabajar para un buen entrevistador. No tiene mucho sentido buscar atajos con la esperanza de engañar a un entrevistador sobre lo que sabes. Debe ser honesto en su currículum, un buen entrevistador tratará de verificar que sabe lo que dice que sabe y no se molestará con los detalles que podrían darle puntos de bonificación, pero nunca afirmó que lo sabe.

Yo mismo me he hecho una pregunta en C ++ porque nunca la borré de mi currículum. Lo busqué, no era terriblemente importante para el trabajo, pero el entrevistador quería saber si realmente sabía todo lo que dije que sabía, y lo hizo seleccionando al azar un elemento menor de mi currículum. Estaba bien dentro de su derecho y me equivoqué por no limpiar mi currículum.

Ser contratado en función de quién es usted y lo que sabe, no acepte un trabajo si no fue desafiado en el proceso de la entrevista. Si el proceso de entrevista puede ser engañado con algunos consejos de Quora que muchos de sus futuros compañeros de trabajo obtuvieron de esa manera, no acepte el trabajo.

Concéntrese en ser contratado por buenas empresas.

Gracias por el A2A.

Una buena pregunta para hacerse antes de asistir a la entrevista sería “¿qué tipo de aprendizaje automático es el enfoque de este puesto?”. Por ejemplo, las tareas de ML para un trabajo de robótica versus finanzas serán muy diferentes tanto en datos como en arquitectura. Donde puede usar cosas como Regresión logística y Regresión lineal con bastante frecuencia en las finanzas, es probable que ML para robótica se centre más en la arquitectura basada en NN.

Te sugiero que primero te deshonestes de los conceptos básicos de tu campo elegido. Después de eso, sé algunas preguntas que definitivamente le haría a un entrevistado.


  • Asegúrese de poder definir la diferencia entre el aprendizaje supervisado y el no supervisado.
  • Asegúrese de pensar en una aplicación de cada uno y defina sus parámetros desde la parte superior de su cabeza.
  • Dibuje una topología de red neuronal para un problema definido, explique por qué eligió esa topología
  • Elija una función de activación, explique por qué la eligió
  • ¿Cómo explicar cómo optimizar la arquitectura NN para un problema específico? (ejecute contra un conjunto de validación cruzada, por ejemplo, cambie su algoritmo de activación, agregue, elimine algunos polinomios, etc.)
  • Qué hacer cuando el entrenamiento resulta en una precisión muy baja para una determinada tarea de aprendizaje supervisado, cómo ajustar y ajustar.

Tenga en cuenta que las tareas anteriores a menudo son complejas y toman * tiempo * para que el entrevistador quiera comprender su proceso de pensamiento. Probablemente no haya respuestas correctas, pero al igual que una entrevista basada en algoritmos, es probable que tenga que escribir algo de código, incluso si es una implementación ingenua.


Finalmente, deje que su pasión por ML se manifieste, venga equipado para hablar sobre algunos proyectos de pasatiempo de ML que ha implementado.

Aquí está mi primera pregunta.

¿Puedes decirme qué es la disputa de datos y guiarme a través de un ejemplo?

Si el entrevistado no puede responder la pregunta, la pantalla del teléfono ha terminado.

Se acabó para el 99% de estos entrevistados después de esta pregunta porque muy pocos entienden realmente el papel.

¿Por qué? Bueno, porque en el mundo real discutimos los datos más que cualquier otra cosa.

Los datos de disputa se realizan en Python y SQL. Si no puede dar masajes a sus datos en una forma que pueda modelarse, entonces no puede hacer el primer paso en el proceso de modelado de extremo a extremo que verá en estos días en casi todos los requisitos de trabajo.

Si quieres trabajar en el mundo real, aprende Python y aprende ahora. Entonces aprende pandas.

Aquí. Te voy a ahorrar algo de dinero. El siguiente curso es gratuito para los primeros 20 lectores de Quora. Quedan 11 más.

El curso completo de Python para ingenieros de aprendizaje automático

Recientemente pasé por un proceso de cambio de trabajo donde entrevisté a 8-10 empresas en la India. Llevaba más de 4 años trabajando en este campo.

Escribí una lista de preguntas que me hicieron en rondas técnicas.

Aquí está el artículo.

https: //appliedmachinelearning.w

More Interesting

Cómo hacer una carrera desde el nivel más básico hasta el nivel profesional en ciencia de datos, aprendizaje automático y aprendizaje profundo

¿Qué tan importante es la optimización de hiperparámetros en los modelos gráficos bayesianos, como la asignación de Dirichlet latente?

¿Qué tan rápido es Theano en comparación con otras implementaciones de DBN? ¿Cómo se compara con otras implementaciones de GPU (potencialmente no públicas) para la velocidad de entrenamiento en grandes conjuntos de datos?

¿Dónde está el mejor lugar para encontrar startups emergentes de aprendizaje automático y PNL?

¿Las computadoras son ahora jugadores de póker más fuertes que los humanos?

En TensorFlow, ¿qué es una capa 'densa' y una 'abandonada'?

¿Por qué tenemos que convertir el valor categórico en factor (en R) o variables ficticias antes de aplicar algoritmos de aprendizaje automático (especialmente regresión lineal)? ¿Afecta nuestros resultados?

¿Qué conjuntos de datos se utilizan como puntos de referencia en los métodos de transcripción de voz / voz y qué métodos tienen los mejores resultados actuales?

¿Qué tan difícil es para un estudiante de pregrado ser aceptado en un grupo de investigación en la universidad?

Cómo utilizar una GPU en mis algoritmos de aprendizaje automático de R

¿Cuál es la diferencia entre minería de datos, aprendizaje automático y reconocimiento de patrones?

¿Las implementaciones físicas de las redes neuronales son claramente preferibles a las GPU?

Cómo leer esta arquitectura de red neuronal convolucional

Cómo poner un programa de IA en un dispositivo

¿Por qué es importante la clasificación en papel de ImageNet con redes neuronales convolucionales profundas?