¿Cuál es el equilibrio entre técnica e intuición para un científico de datos exitoso?

La intuición es cómo saber qué técnicas se ajustan a los datos disponibles, la situación y los resultados deseados (aunque la intuición probablemente no sea la palabra adecuada)

Utiliza su experiencia y comprensión para construir la lógica en torno al modelado y para reconocer cuándo sus modelos están logrando sus objetivos analíticos.

Es posible que sepa cómo atar 100 tipos diferentes de nudos, pero eso no lo ayudará a abrocharse un zapato abrochado. Es mejor poder pensar lógicamente sobre el cierre, que saber cómo lograr algunas formas comunes de hacerlo sin saber cómo elegir los zapatos adecuados para sus técnicas.

Una técnica solo es útil para usted como científico de datos si es útil en esta situación en este momento. Es importante tener una sólida comprensión de las técnicas y grupos de técnicas, pero tener una idea de cómo se aplican sus datos a su dominio, qué dentro de estos datos es relevante para su pregunta actual y dónde podría ser inadecuado tiene mucho que ver con cómo construye y PRUEBA tu modelo.

Es posible que pueda encontrar una mejor técnica con una mejor comprensión de las partes no técnicas de la ecuación. Esto contribuye al éxito o fracaso final del proyecto. (aunque los proyectos fallan todo el tiempo porque simplemente no son factibles con sus datos y recursos también, y no es necesariamente un fracaso del científico de datos … revelamos relaciones en los datos con eventos del mundo real, pero no reestructuramos mágicamente cómo las cosas suceden con los datos).

Es fácil sobreestimar cuánto tiempo pasará programando y subestimar cuánto tiempo pasará pensando, hablando, leyendo, elaborando pequeños experimentos y probando los resultados. Esto tiende a exagerar la idea de que conocer técnicas es ciencia de datos. Algunas ofertas de trabajo empeoran al pedir dominio en una gran cantidad de técnicas a nivel de despliegue … muy pocas personas son maestras de todo en ese nivel.

En general, conocer algunas técnicas de manera magistral y conocer los procesos de pensamiento necesarios para construir un modelo completo a través del despliegue mientras se puede pensar profunda y críticamente es una mejor preparación para tener éxito a largo plazo que haber hecho una vez todo de una vez con un bajo nivel de comprensión. .

Diría que la intuición de las preguntas comerciales correctas y la idoneidad de los métodos para responder esas preguntas comerciales es mucho más importante que la familiaridad con la técnica metodológica. Esto se debe simplemente a que toda la educación formal o informal se centra casi por completo en brindarle más información sobre los métodos, pero casi nunca sobre los matices de cuándo sacarlos de su caja de herramientas. Como resultado, cada científico de datos bien capacitado es excelente en la técnica, pero a menudo no se perfecciona al formular una pregunta comercial y al aplicar los métodos correctos para responderla a satisfacción de los interesados. En otras palabras, las personas están mejor capacitadas a lo largo de su educación para responder preguntas pero no para hacer las preguntas correctas. Por lo tanto, la última habilidad es más rara para ser entrenada y, por lo tanto, más importante y distintiva para un científico de datos .