Definir “cómo usar”. ¿Se puede codificar en R y obtener salida? Todavía no necesariamente sabes cómo usarlos. ¿Puede hacerlo y obtener resultados y saber cómo interpretar los resultados y puede comprender las implicaciones de esos resultados para el análisis futuro? ¿Puedes escribir para un público lego? Ahora, podría decir que sabe “cómo usar”.
¿Puedes responder las siguientes preguntas con autoridad y confianza?
- ¿Qué lenguaje de script puede funcionar con Big Data?
- ¿Cuáles son algunas cosas que todo consultor de análisis de datos debe saber?
- ¿Con qué herramientas o tecnologías debería estar familiarizado para conseguir un trabajo en el análisis de datos?
- ¿Vale la pena hacer ciencia de datos?
- ¿Cuáles son las habilidades básicas de un científico de datos?
21 preguntas y respuestas de la entrevista de ciencia de datos imprescindibles
¿O simplemente estás “jugando a” la ciencia de datos como el culo de aspecto inteligente de arriba?
La ciencia de datos es comprender lo que sucede bajo el capó de las bibliotecas y las herramientas preconstruidas. Desafortunadamente, muchos científicos de datos no entienden esto.
Hoy en día, se entiende cada vez más que la ciencia de datos abarca un campo amplio, que incluye estadísticas, análisis de negocios, almacenamiento de datos, bases de datos (tanto relacionales como NO-SQL). En algunas empresas, los trabajos de científicos de datos podrían ofrecerse a personas que solo construirán y mantendrán procesos de minería e ingestión de Big Data, pero no estarán directamente involucrados en el análisis de datos. Estos son los profesionales de TI que pueden trabajar y, cuando sea necesario, comunicarse con los estadísticos y analistas de negocios, en su idioma.
Sin embargo, los científicos de datos también deben conocer los principios estadísticos y comprenderlos. ¿Cómo puedes construir un modelo que se ajuste bien si no entiendes estas cosas? ¿Cómo puede saber si usar un modelo de regresión lineal versus un modelo KNN si no sabe cómo funcionan? ¿Cuándo debería estandarizar sus variables predictoras y por qué?
Esta pregunta escucha los tópicos recurrentes en la programación de computadoras como “Los programadores reales saben C”, etc. “Los científicos de datos reales pueden escribir la prueba de [insertar un teorema estadístico complejo aquí]”. ¿Estás de acuerdo?
Yo diría que el campo de la ciencia de datos necesita más econométricos, actuarios y estadísticos; sin embargo, una comprensión sólida y básica de cómo funcionan las estadísticas descriptivas y predictivas puede ayudar en gran medida a apoyar la toma de decisiones en organizaciones grandes y pequeñas por igual.
Un buen lugar para comenzar es con las bibliotecas y herramientas de ciencia de datos a su alcance. Pero debes entender lo que está sucediendo para ser un científico de datos.