La intuición es cómo saber qué técnicas se ajustan a los datos disponibles, la situación y los resultados deseados (aunque la intuición probablemente no sea la palabra adecuada)
Utiliza su experiencia y comprensión para construir la lógica en torno al modelado y para reconocer cuándo sus modelos están logrando sus objetivos analíticos.
Es posible que sepa cómo atar 100 tipos diferentes de nudos, pero eso no lo ayudará a abrocharse un zapato abrochado. Es mejor poder pensar lógicamente sobre el cierre, que saber cómo lograr algunas formas comunes de hacerlo sin saber cómo elegir los zapatos adecuados para sus técnicas.
- ¿Qué debo hacer a continuación para conseguir un trabajo en Data Science y Machine Learning en India?
- ¿Hay alguna pregunta moral al trabajar con Big Data?
- ¿Puedo hacer cosas de aprendizaje automático / minería de datos sin ser un "tomador de decisiones"?
- ¿Cuál es la diferencia entre ingeniería de datos y minería de datos?
- ¿Hay alguna universidad canadiense que ofrezca un buen programa de maestría en ciencias de datos con becas internacionales?
Una técnica solo es útil para usted como científico de datos si es útil en esta situación en este momento. Es importante tener una sólida comprensión de las técnicas y grupos de técnicas, pero tener una idea de cómo se aplican sus datos a su dominio, qué dentro de estos datos es relevante para su pregunta actual y dónde podría ser inadecuado tiene mucho que ver con cómo construye y PRUEBA tu modelo.
Es posible que pueda encontrar una mejor técnica con una mejor comprensión de las partes no técnicas de la ecuación. Esto contribuye al éxito o fracaso final del proyecto. (aunque los proyectos fallan todo el tiempo porque simplemente no son factibles con sus datos y recursos también, y no es necesariamente un fracaso del científico de datos … revelamos relaciones en los datos con eventos del mundo real, pero no reestructuramos mágicamente cómo las cosas suceden con los datos).
Es fácil sobreestimar cuánto tiempo pasará programando y subestimar cuánto tiempo pasará pensando, hablando, leyendo, elaborando pequeños experimentos y probando los resultados. Esto tiende a exagerar la idea de que conocer técnicas es ciencia de datos. Algunas ofertas de trabajo empeoran al pedir dominio en una gran cantidad de técnicas a nivel de despliegue … muy pocas personas son maestras de todo en ese nivel.
En general, conocer algunas técnicas de manera magistral y conocer los procesos de pensamiento necesarios para construir un modelo completo a través del despliegue mientras se puede pensar profunda y críticamente es una mejor preparación para tener éxito a largo plazo que haber hecho una vez todo de una vez con un bajo nivel de comprensión. .