¿Cuáles son las preguntas más frecuentes sobre entrevistas de ciencia de datos?

Realmente depende de la posición que está solicitando. Creo que una buena manera de responder a su pregunta es dividir las posiciones de ciencia de datos en varias categorías. Me centraré en los más populares: Business Intelligence Analyst, Data Analyst y, por supuesto, Data Scientist.

Comenzaré con las responsabilidades principales, para que pueda entender por qué estas preguntas son relevantes. Luego le daré mi opinión sobre por qué le harían esa pregunta específica.

Analista de Inteligencia de Negocios. El analista de BI tiene dos rasgos definitorios: trabaja con datos (a menudo datos internos) y tiene una base comercial sólida.

Supongamos que necesita ayudar a una tienda minorista con su gestión de inventario. Deberá recopilar los datos, diseñar las métricas y, finalmente, analizarlas. Posteriormente, es probable que deba visualizarlo de manera amigable para el administrador.

Entonces, ¿preguntas frecuentes en las entrevistas para un analista de BI?

  1. Describa las diferentes partes de una consulta SQL.
    Es posible que quieran verificar si está familiarizado con el lenguaje de programación SQL. Si el trabajo involucra SQL, asegúrese de que le pregunten muchos de esos.
  2. Estamos pensando en implementar una solución de BI, como Tableau o Power BI. ¿Cómo realizarías el proceso de implementación?
    La ciencia de datos está aumentando, por lo que muchas empresas quieren crear un equipo de ciencia de datos pero realmente no saben cómo abordarlo. Pueden confiar en ti para eso. Alternativamente, es posible que se le pregunte acerca de su experiencia con una solución de BI, ya que ya tienen una y están buscando a alguien que la utilice.
  3. Obtiene visitas A en un sitio web en el que está anunciando. B personas hacen clic en un anuncio. C personas compran su producto. ¿Cuál es la tasa de conversión? ¿Cómo calcularía el costo para adquirir un cliente?
    Un analista de BI también puede participar en los esfuerzos de marketing de una empresa. Aún así, un poco de preparación comercial y una lógica sólida serán suficientes para la mayoría de las preguntas de este tipo.

Analista de datos. Un analista de datos tiene diferentes responsabilidades; por lo tanto, puede esperar diferentes preguntas frecuentes. Se espera que pueda trabajar con datos en muchos niveles. Desde la limpieza de datos, pasando por el análisis real, hasta la presentación de resultados. A menudo hay algunos modelos involucrados, como regresión, factor, análisis de conglomerados.

Por ejemplo, se le puede pedir que proyecte las ventas de una empresa, en función de algunas métricas (o tendencias) comunes. Tal vez necesite descargar los datos, preprocesarlos, por lo que es útil para la codificación, y crear una regresión que arroje una predicción sobre las ventas futuras.

Entonces, preguntas frecuentes:

  1. Tienes un cubo de 10x10x10. ¿Cuál es la superficie exterior?
    Se espera que seas una persona muy analítica. A menudo, los entrevistadores verifican su pensamiento crítico a través de un acertijo.
  2. ¿Cuál es la diferencia entre DELETE y TRUNCATE?
    Algunos SQL nunca están de más.
  3. Identificar problemas en una hoja de cálculo.
    No solo en ciencia de datos, sino también en auditoría y consultoría, pueden pedirle que encuentre errores. Están probando su atención al detalle y competencia al mismo tiempo.
  4. ¿Qué datos pediría si necesita predecir la retención del cliente?
    Es posible que no puedan verificar sus habilidades de regresión en la entrevista, pero seguramente se asegurarán de que sepa cómo abordar un problema.

Científico de datos. Probablemente su pregunta fue diseñada para abordar este puesto de trabajo. La posición del científico de datos es difícil de definir exactamente, pero en general, él / ella debe comprender los procesos de negocios, mientras que tiene la preparación técnica relacionada con las habilidades estadísticas, la programación. Cada vez más, el aprendizaje automático parece ser imprescindible.

Si tiene un problema, por ejemplo, para predecir qué clientes se quedarán con la empresa (retención de clientes), lo más probable es que usted sea el que diseñe un algoritmo de aprendizaje automático. Deberá poder identificar los datos necesarios, recopilarlos, preprocesarlos y finalmente analizarlos mediante alguna técnica de aprendizaje automático. Si hay un equipo completo de ciencia de datos, es posible que también desee que el científico de datos tenga habilidades de gestión y liderazgo. Finalmente, también se requieren habilidades de presentación, narración de cuentos y la capacidad de explicar un problema complicado de una manera simple.

Preguntas frecuentes:

  1. ¿Qué significa para usted el término “ciencia de datos”?
    Si está solicitando el puesto, seguramente sabe qué es la ciencia de datos. Aún así, dado que no solo necesita habilidades técnicas, sino también excelentes habilidades comunicativas, esta es una buena manera de ver cómo su persona piensa y estructura sus pensamientos.
  2. ¿Cuáles son los supuestos de una regresión lineal?
    Las regresiones lineales se usan cada vez menos en presencia de algoritmos de aprendizaje automático, pero aún así, este es un conocimiento técnico que estas personas deberían tener (ya que es un punto de partida).
  3. Dibuje un gráfico relevante para un anuncio de pago por clic.
    Esta pregunta verifica sus habilidades analíticas, habilidades técnicas y conocimiento de los procesos comerciales. Naturalmente, muchos problemas de ciencia de datos están relacionados con el marketing, por lo tanto, es probable que le pregunten algo en ese sentido.
  4. ¿Cómo puede probar que una mejora que introdujo en un modelo realmente está funcionando?
    Este punto se refiere a modelos que verifican si otros modelos funcionan. Desea que su científico de datos no solo implemente algoritmos, sino que pueda medir el impacto.
  5. ¿Cómo explicaría NNs / Random Forest / etc. a una persona no técnica?
    Una vez más: habilidades de presentación y capacidad para expresar pensamientos complicados de una manera simple.
  6. ¿Qué tipos de aprendizaje automático hay? Explica las diferencias entre ellos.
    Esa es también una pregunta fácil para alguien que ha hecho aprendizaje automático, pero es una muy buena manera de verificar la estructura de pensamientos del solicitante.
  7. Dé ejemplos donde el falso positivo / falso negativo sea más importante.
    Esa es una pregunta común que verifica el conocimiento estadístico y el conocimiento del diseño del modelo.
  8. Cuéntanos sobre algunos prejuicios que es probable que encuentres cuando …
    Los prejuicios son un gran problema en la economía del comportamiento. Esta pregunta se refiere a su intuición, conocimiento y capacidad para formular hipótesis sobre sus datos o interpretar resultados, después de haber analizado los datos.

Entonces, estas son algunas preguntas frecuentes. Obviamente, depende del país, la compañía, el equipo y el puesto al que se postula, pero, en general, la mayoría de las preguntas son similares.

¡Espero que ayude!

  1. ¿Qué es la ciencia de datos?
  2. ¿Qué técnica se usa para predecir respuestas categóricas?
  3. ¿Qué es la regresión logística? O diga un ejemplo cuando haya usado regresión logística recientemente.
  4. ¿Qué son los sistemas de recomendación?
  5. ¿Por qué la limpieza de datos juega un papel vital en el análisis?
  6. Diferenciar entre análisis univariado, bivariado y multivariado.
  7. ¿Qué entiendes por el término Distribución Normal?
  8. ¿Qué es la regresión lineal?
  9. ¿Qué es la interpolación y extrapolación?
  10. ¿Qué es el análisis de poder?
  11. ¿Qué es K-significa? ¿Cómo puedes seleccionar K para K-means?
  12. ¿Qué es el filtrado colaborativo?
  13. ¿Cuál es la diferencia entre clúster y muestreo sistemático?
  14. ¿Son diferentes el valor esperado y el valor medio?
  15. ¿Los métodos de descenso de gradiente siempre convergen al mismo punto?
  16. ¿Qué son las variables categóricas?
  17. ¿Cómo puede normalizar los datos con la transformación Box-Cox?
  18. ¿Cuál es la diferencia entre el aprendizaje supervisado y el aprendizaje no supervisado?
  19. Explicar el uso de la combinatoria en la ciencia de datos.
  20. ¿Por qué la vectorización se considera un método poderoso para optimizar el código numérico?
  21. ¿Qué es la regularización y qué tipo de problemas resuelve la regularización?
  22. ¿Qué es la multicolinealidad y cómo se puede superar?
  23. ¿Cuál es la maldición de la dimensionalidad?
  24. ¿Cómo decide si su modelo de regresión lineal se ajusta a los datos?
  25. ¿Cuál es la diferencia entre el error al cuadrado y el error absoluto?
  26. ¿Qué es el aprendizaje automático?
  27. ¿Cómo se construyen los intervalos de confianza y cómo interpretará?
  28. ¿Cómo explicará la regresión logística a un economista, científico físico y biólogo?
  29. ¿Cómo puedes superar el sobreajuste?
  30. ¿Diferenciar entre formatos de datos anchos y altos?
  31. ¿Es malo Bayes? En caso afirmativo, bajo qué aspectos.

Además de las preguntas de la entrevista, es mejor practicar para la entrevista en tiempo real. Me gustaría sugerir en dicha plataforma, es decir, InterviewBuddy- ( https://interviewbuddy.in/ ). Realizarán las entrevistas de práctica con expertos de la industria y proporcionarán el cuadro de mando detallado para mejorar las habilidades de entrevista.

Esta primera parte de una serie de preguntas y respuestas de entrevistas de ciencia de datos se centra solo en los temas generales, como preguntas sobre datos, probabilidad, estadísticas y otros conceptos de ciencia de datos.

1. ¿Qué técnica se usa para predecir respuestas categóricas?

2.Diferenciar entre análisis univariado, bivariado y multivariado?

3. ¿Cómo puede normalizar los datos con la transformación Box-Cox?

4. ¿Cómo puede iterar sobre una lista y también recuperar índices de elementos al mismo tiempo?

5.Escriba una función que tome dos listas ordenadas y genere una lista ordenada que es su unión.

6. ¿Cuál es la diferencia entre el error al cuadrado y el error absoluto?

7. ¿Puede explicar la diferencia entre un conjunto de prueba y un conjunto de validación?

8) ¿Explicar los diversos beneficios del lenguaje R?

¿Por qué la limpieza de datos es importante en el análisis de datos?

10. ¿Explicar sobre la distribución normal?

Para obtener más preguntas y respuestas, consulte el siguiente enlace: https: /www.bepec.in/data-science-r

Si bien las preguntas que se le pueden hacer cambian en función del puesto al que se postula, unas pocas son universales en todas las entrevistas de ciencia de datos. Se le harán preguntas estadísticas y / o basadas en la programación, que incluyen ¿Cuál es la ley de los grandes números, ¿Cuál es el objetivo de las pruebas A / B ?, y ¿Qué es el filtrado colaborativo? Dado que la lista es exhaustiva, me resulta difícil hacer justicia a esta pregunta. En cambio, aquí hay una lista de preguntas de entrevistas de ciencia de datos que hemos cumplido. Esta lista consta de preguntas de ciencia de datos que pueden aparecer en una entrevista y respuestas a ellas.

Espero haber ayudado!