Trabajando como científico de datos en este momento, creo que parece que quieren que trabajes como parte de un equipo. Como tal, debe ser flexible en su enfoque para resolver problemas. A continuación, le doy una idea del tipo de preguntas que me hacen / tengo que pensar.
En la etapa de diseño, es posible que tenga algunas ideas, su favorita requiere que se almacene algún estado adicional. Al resto del equipo le preocupa que haga que el sistema sea demasiado complejo / costoso, por lo que crea una idea sin ningún estado con el que comparar. ¿Se puede cambiar la precisión por conveniencia? ¿Cuánto estado se requeriría? ¿Se puede utilizar el estado del sistema existente en su lugar?
Luego en la etapa de implementación; ¿hay alguna buena biblioteca que lo haga por ti? ¿En qué idiomas están? ¿Cuánto tiempo llevaría implementarlo en el idioma en que se encuentra el resto del sistema?
- ¿Vale la pena aprender sobre ciencia de datos?
- ¿Vale la pena hacer ciencia de datos?
- ¿Qué es una fuente de datos?
- ¿Cuáles son las mejores prácticas para construir algo así como un servicio de noticias?
- Cómo probar A / B una nueva aplicación de mensajería sin restringir con qué miembros pueden hablar (es decir, los miembros en el grupo de "prueba" aún pueden enviar mensajes a los miembros en el grupo de "control")
Entonces, evaluación, ¿qué tan precisa es? Si es un clasificador, ¿cuál es el puntaje F? ¿Necesita más precisión / recuperación o un equilibrio uniforme? Que tan rapido es ¿Se escalará adecuadamente? Y, en última instancia, ¿la analítica es adecuada para el uso que le da un usuario?
Por lo tanto, es una serie compleja de decisiones estadísticas y de ingeniería que hacen una gran analítica.